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内 容 提 要 
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的 编程 任务 。 读 者 既 可 通过 本 书 深入 了 解 Clojure 的 精髓 ,也 可 将 本 书 用 作 参 考 指南 ,解决 具体 问题 。 
本 书 适合 各 层次 Clojure 开发 人 员 阅 读 。 
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约 二 十 年 前 ， 我 买 过 一 本 高 等 教育 出 版 社 出 版 的 《LISP 语言 》， 作者 是 马 希 文 、 宋 柔 。 可 
惜 当年 没有 老师 指导 ， 自 己 水 平 不 够 ， 未 能 深入 下 去 ， 只 留 下 了 一 点 模糊 的 印象 : LISP 语 
言 适 用 于 人 工 智 能 ， 括 号 很 多 。 











几 年 前 ， 图 灵 公 司 的 朋友 送 我 一 本 《黑客 与 画家 》， 我 连夜 看 完 ， 重 新 燃 起 了 对 LISP 的 
兴趣 。 我 在 书评 中 写 道 :“ 读 完 之 后 有 一 种 想 去 学 习 LISP 语言 的 冲动 。 一 个 不 懂 LISP 的 
Java 程序 员 ， 不 是 一 个 好 的 C++ 程序 员 。” 





现在 ， 我 终于 找到 了 机 会 ， 开 始 学 习 Clojure 这 种 运行 在 JVM 上 的 LISP 方言 。 经 过 一 段 
时 间 的 学 习 ， 我 完全 被 它 迷 住 了 ! 


首先 吸引 我 的 是 它 的 函数 式 编程 特性 。 作 为 一 个 学 习 C++ 和 Java 多 年 的 程序 员 ， 我 已 习 
惯 在 程序 中 使 用 各 种 名 词 抽象 ， 也 就 是 领域 术语 ， 和 希望 在 程序 中 体现 领域 专家 的 思想 和 认 
识 水 平 。 而 在 Clojure 编程 中 ， 虽 然 它 也 很 适合 领域 抽象 ， 但 它 的 抽象 程度 更 高 ， 它 希望 
达到 数学 家 认识 世界 的 水 平 。 问 题 的 开头 通常 是 “给 定 一 个 无 限 序 列 ……”， 而 常见 的 例 
子 是 如 何 实现 斐 波 那 契 数 列 。 





























Leslie Lamport 说 过 ， 要 将 事情 描述 得 清晰 准确 ， 人 类 发 明 的 最 好 语言 就 是 数学 。 这 种 对 
“表达 的 经 济 性 ”的 追求 ， 对 于 中 国人 是 不 陌生 的 。 中 国 是 诗歌 的 国度 ， 而 且 古 人 对 言 简 
意 凡 的 追求 也 有 许多 例子 ， 比 如 “ 逸 马 杀 犬 于 道 ” 的 故事 。 所 以 我 觉得 ，LISP/Clojure 在 
精神 上 与 有 追求 的 中 国 程序 员 是 契合 的 。 
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其 次 ， 它 特别 适合 开发 领域 特定 语言 (DSL)。 在 LISP 社区 中 流传 着 一 个 笑话 ， 可 以 说 明 
这 一 点 : 任何 足够 大 的 软件 ， 最 后 都 会 实现 一 个 半 调 子 LISP 解析 器 。LISP 的 底层 抽象 极 
其 简单 ， 允 许 程序 员 设 计 更 多 的 抽象 ， 来 描述 这 个 世界 。 


学 习 一 门 新 的 语言 ， 会 改变 学 习 者 的 思维 方式 。 在 面向 对 象 编程 时 ， 我 们 更 多 关注 单个 
对 象 。 在 函数 式 编 程 中 ， 我 们 更 多 关注 函数 和 和 集合。 在 工作 中 ， 不 一 定 马上 有 机 会 使 用 
Clojure， 但 其 中 学 到 的 思维 方式 ， 将 对 编程 产生 立竿见影 的 影响 。 在 翻译 本 书 时 ， 我 同时 
在 用 Lua 开发 项 目 ， 学 习 了 Clojure， 让 我 能 写 出 更 简洁 、 更 优雅 的 Lua 代码 。 



























































学 习 新 语言 有 这 样 一 些 原则 : (1) 专注 于 与 你 相关 的 内 容 ，(2) 从 学 习 这 门 语言 的 第 一 天 
起 ， 就 把 它 当 作 你 的 交流 方式 ，(3) 当 你 听 得 懂 别 人 在 说 什么 时 ， 就 会 不 知 不 觉 慢 慢 习 得 
这 门 语言 ，(4) 语言 不 是 大 量 的 知识 积累 ， 而 更 像 一 种 生理 训练 ，(5) 心理 状态 和 生理 状 
态 都 很 重要 ， 要 愉快 和 放松 。 对 于 模 核 两 可 要 有 一 定 的 容忍 性 ， 对 于 细 枝 末节 不 要 过 于 纠 
结 ， 因 为 那 会 把 你 逼 疯 。 


本 书 提供 了 大 量 的 例子 ， 和 覆盖 了 日 常 编程 领域 的 方方面面 ， 正 是 学 习 Clojure 的 好 读物 。 
在 翻译 本 书 的 过 程 中 ， 我 学 到 了 很 多 ， 在 此 郑重 推荐 给 大 家 。 不 足 之 处 ， 还 望 大 家 指正 。 






























































王 海 鹏 


2014 年 秋 
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本 书 的 首要 目标 是 提供 中 等 长 度 的 Clojure 代码 示例 ， 超 越 基本 知识 ， 关 注 真实 世界 的 日 
常 应 用 程序 〈 而 不 是 概念 或 学 术 问题 )。 


与 此 前 的 许多 其 他 Clojure 书籍 不 同 ， 本 书 的 主题 不 是 语言 本 身 ， 或 它 的 功能 和 能 力 。 本 


书 关注 开发 者 面 对 的 具体 任务 〈 不 论 他 们 使 用 哪 种 编程 语言 ) ， 展 示 如 何 用 Clojure 来 解决 
这 些 具 体 问题 。 


























因此 ， 本 书 确实 不 是 也 做 不 到 包罗 万 象 ， 因 为 可 能 的 问题 示例 有 无 限 多 个 。 但 是 ， 我 们 希 
望 记录 大 多 数 程序 员 会 经 常 遇 到 的 一 些 比较 常见 的 问题 。 通 过 归纳 ， 读 者 将 能 够 学 到 一 些 
常见 的 模式 、 方 法 和 技术 ， 有 助 于 他 们 为 自己 面 对 的 问题 设计 解决 方案 。 


本 书 如 何 与 成 


关于 本 书 ， 你 要 了 解 一 件 重 要 的 事情 : 它 首 先是 团队 协作 的 成 果 。 它 不 是 由 一 两 个 人 写成 
的 ， 黄 至 不 是 一 个 确定 好 的 团队 的 成 果 。 相 反 ， 它 是 60 多 个 最 优秀 的 Clojure 程序 员 协 作 
的 结果 ， 他 们 来 自 世 界 各 地 、 各 行 各 业 。 这 些 作者 每 天 都 在 真实 的 场景 中 使 用 Clojure: 从 
航空 航天 到 社交 媒体 ， 从 银行 业 到 机 器 人 ， 从 AI 研究 到 电子 商务 。 












































因此 ， 你 会 在 提供 的 实例 中 看 到 许多 差异 。 有 些 快 速 而 简要 ， 有 些 则 内 容 更 为 丰富 ， 针 对 
Clojure 的 基本 原理 和 实现 提供 了 易于 理解 的 深刻 洞 见 。 





我 们 希望 兴趣 各 异 的 读者 都 能 从 本 书 中 有 所 获 。 我 们 相信 ， 它 的 用 处 不 仅 在 于 查找 具体 问 
题 的 解决 方案 ， 也 在 于 考察 Clojure 能 够 提供 的 各 种 表达 能 力 。 在 编辑 提交 的 内 容 时 ， 我 
们 非常 吃惊 地 发 现 很 多 概念 和 技术 对 我 们 来 说 也 是 新 的 ， 希 望 对 读者 来 说 也 是 新 的 。 


我 们 在 写作 和 编辑 时 还 发 现 ， 要 确定 我 们 想 介绍 的 内 容 的 范围 是 一 件 很 难 的 事情 。 每 个 实 
例 都 很 棒 ， 可 以 无 限 细 分 ， 进 而 涉及 多 个 话题 ， 而 每 个 话题 又 值得 写 一 个 实例 、 一 章 其 至 



































xiii 


一 本 书 。 但 每 个 实例 也 需要 保持 独立 。 每 个 实例 应 该 提供 一 些 有 用 的 、 有 价值 的 信息 ， 让 
读者 可 以 理解 并 消化 。 














我 们 真诚 地 希望 自己 很 好 地 平衡 了 这 些 目 标 ， 也 希望 你 觉得 这 本 书 有 用 而 不 乏味 ， 内 容 深 


刻 而 不 是 艰深 难 懂 。 























= 二 

读者 对 象 

我 们 希望 所 有 使 用 Clojure 的 人 都 能 从 本 书 中 学 到 一 些 东 西 。 有 许多 实例 介绍 的 是 真正 
ee oe I 





用 ， 


有 助 于 他 们 开始 实践 。 


























但 如 果 你 是 Clojure 新 手 ， 这 可 能 不 是 你 要 看 的 第 一 本 书 ， 至 少 不 要 只 看 这 本 书 。 本 书 介 
绍 了 许多 有 用 的 话题 ， 但 不 像 优秀 的 入 门 教材 那样 系统 或 完整 。 下 面 列 出 了 一 般 的 Clojure 
书籍 ， 将 它们 作为 前 导 教 材 或 补充 教材 会 很 有 帮助 。 


其 他 资源 
本 书 内 容 并 不 全 面 ， 也 永远 不 可 能 全 面 。 有 许多 内 容 要 讲 ， 并 且 由 于 采用 了 面向 任务 的 实 
例 ， 自 然 就 排除 了 有 和 条理、 叙述 式 地 解释 整个 语言 的 特点 和 能 


要 更 线性 、 彻 底 地 了 解 Clojure 及 其 特点 ， 我 们 推荐 下 面 的 书 。 



























































《Clojure 编程 : Java 世界 的 Lisp 实践 》(O’Reilly，2012)， 作 者 是 Chas Emerick、Brian 
Carper 和 Christophe Grand。 这 是 一 本 全 面 的 、 用 于 一 般 目 的 的 Clojure 好 书 ， 关 注 语言 
和 常见 任务 ， 面 向 Clojure 的 初学 者 。 
《Clojure 程序 设计 (第 2 版 )》(Pragmatic Bookshelf，2012)， 作 者 是 Stuart Halloway 和 
Aaron Bedra。 这 是 第 一 本 关于 Clojure 的 书 , 为 Clojure 语言 提供 了 清晰 全 面 的 介绍 和 指导 
Practical Clojure (Apress，2010)， 作 者 是 Luke VanderHart 和 Stuart Sierra。 它 简明 扼 
要 地 解释 了 Clojure 是 什么 ， 它 的 特点 是 什么 。 
《Clojure 编程 乐趣 》(Manning，2011) ， 作 者 是 Michael Fogus 和 Chris Houser。 这 是 一 
本 比较 高 级 的 教材 ， 真 正 深入 到 Clojure 的 主题 和 原理 。 
ee Up and Running (O"Reilly，2012)， 作 者 是 Stuart Sierra 和 Luke Vander 
。 虽 然 本 书 和 这 里 列 出 的 其 他 Clojure 书籍 主要 或 全 部 在 探讨 Clojure 本 身 ， 但 
Re (一 种 Clojure 方言 ， 能 编译 成 JavaScript) 已 经 得 到 了 相当 的 发 展 。 这 本 
书 介绍 了 ClojureScript， 以 及 如 何 使 用 它 ， 并 探讨 了 ClojureScript 和 Clojure 之 间 的 相似 
与 不 同 。 




























































































最 后 ， 你 应 该 看 看 本 书 的 源 代 码 ， 它 们 可 以 从 GitHub 自由 下 载 (https://github.com/clojure- 
cookbook/clojure-cookbook)。 网 上 选择 的 实例 比 印刷 版 本 更 多 ， 我 们 仍 在 接受 新 实例 的 
“ 拉 取 请 求 ”(pull request) ， 也 许 某 天 会 加 入 本 书 的 下 一 版 。 


本 书 结构 


本 书 的 章节 主要 是 依据 主题 对 实例 进行 分 组 ， 而 不 是 严格 的 分 类 。 一 个 实例 完全 有 可 能 适 
用 于 不 止 一 个 章节 ， 在 这 种 情况 下 ， 我 们 试 着 根据 我 们 的 猜测 ， 将 它 放 在 大 部 分 读者 首先 
会 去 寻找 的 地 方 。 

















实例 包含 三 个 主要 部 分 和 一 个 次 要 部 分 : 问题 、 解 决 方案 、 讨 论 和 参阅 。 实 例 的 问题 陈述 
提出 了 任务 或 要 克服 的 障碍 。 它 的 解决 方案 解决 了 问题 ， 展 示 了 特定 的 技术 或 库 ， 能 够 高 
效 地 完成 该 任务 。 讨 论 完善 了 相关 知识 ， 探 讨 了 解决 方案 和 相关 注意 事项 。 最 后 ， 参 阅 部 
分 向 读者 指出 了 一 些 附加 的 资源 或 相关 实例 ， 帮 助 你 采用 描述 的 解决 方案 。 


各 章 简介 
本 书 由 以 下 儿童 构成 。 


。 第 1 章 “ 原 生 数 据 ” 和 第 2 章 “ 复 合 数 据 ” 介 绍 了 Clojure 内 建 的 原生 和 复合 数据 结构 ， 
解释 了 许多 常见 的 (以 及 不 太 常 见 的 ) 使 用 方式 。 

。 第 3 章 “ 广 义 计 算 ” 包 含 了 一 些 有 用 的 主题 ， 广 泛 适 用 于 许多 不 同 的 应 用 领域 和 项 目 ， 
从 协议 这 样 的 Clojure 特征 ， 到 可 选 的 编程 范式 ， 例 如 用 core.tLogic 实现 逻辑 编程 ， 或 
用 core.async 实现 异步 协作 。 

。 第 4 章 “ 本 地 IJO” 包 含 了 程序 在 运行 时 与 本 地 计算 交互 的 所 有 方式 。 这 包括 读 写 标准 
输入 输出 流 ， 创 建 并 操作 文件 ， 序 列 化 和 反 序 列 化 文件 等 。 

。 第 5 章 “ 网 络 1O 和 Web 服务 ”包含 了 类 似 第 4 章 的 主题 ,但 探讨 的 是 通过 网 络 的 远 
程 通信 。 它 包括 的 实例 涉及 各 种 网 络 通信 协议 和 库 。 

。 第 6 章 “ 数 据 库 ” 展 示 了 连接 和 使 用 各 种 数据 库 的 技术 和 工具 。 特 别 关注 了 Datomic 数 
据 库 ， 它 共享 了 Clojure 背后 关于 值 、 状 态 和 标识 的 哲学 ， 并 扩展 到 了 持久 存储 的 领域 。 

。 第 7 章 “Web 应 用 ”深入 探讨 了 Clojure 最 常见 的 应 用 领域 : 构建 和 维护 动态 网 站 。 它 
全 面 介绍 了 Ring(Clojure 中 最 流行 的 HTTP 服务 器 库 ) ,以 及 HTML 模板 和 演 染 的 工具 。 

。 第 8 章 “ 性 能 与 开发 效率 ”解释 了 拥有 Clojure 程序 之 后 还 需要 做 些 什 么 介绍 了 打包 、 
分 发 、 性 能 剖析 、 日 志 的 常见 模式 ， 将 正在 进行 的 任务 与 应 用 的 生命 周期 关联 起 来 。 

。 第 9 章 “ 分 布 式 计算 ”关注 云 计算 以 及 在 重量 级 分 布 式 数据 处 理 中 使 用 Clojure。 特 别 
关注 了 Cascalog， 它 是 一 个 声明 式 Clojure 接口 ， 面 向 Hadoop MapReduce 框架 。 

。 最 后 但 同样 重要 的 是 第 10 章 “ 测 试 ” 介 绍 了 各 种 技术 ， 来 确保 代码 和 数据 的 完整 性 和 
正确 性 : 从 传统 的 单元 测试 和 集成 测试 ， 到 更 全 面 的 产生 式 测 试 和 模拟 测试 ， 其 至 还 有 
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出 吾 XV 


可 选 的 编译 时 验证 ， 利 用 core.typed 实现 静态 类 型 。 


/7 > 
软件 获取 
车 要 按照 本 书 的 实例 操作 ， 你 需要 正确 安装 Java 开发 工具 (JDK) 和 Clojure 事实 上 的 构建 工 
具 Leiningen。 我 们 推荐 第 7 版 JDK， 但 至 少 需 要 第 6 版 。 对 于 Leiningen， 至 少 是 第 2.2 版 。 





如 果 你 还 没 安装 Java (或 者 希望 升级 )， 请 访问 Java 下 载 页 面 (http://www.oracle.com/ 
technetwork/java/javase/downloads/index.html) ， 按 提示 下 载 并 安装 Java JDK。 





要 安装 Leiningen， 请 遵循 Leiningen 网 站 (http:Wleiningen.org/) 的 安装 指南 。 如 果 已 经 安 
装 了 Leiningen， 通 过 执行 lein upgrade 命令 来 取得 最 新 版 本 。 如 果 不 熟 悉 Leiningen， 请 
访问 使 用 指南 (https://github.com/technomancy/leiningen/blob/stable/doc/TUTORIAL.md)， 
了 解 更 多 信息 。 


你 不 需要 手工 安装 的 就 是 Clojure 本 身 ， 因 为 Leiningen 将 随时 根据 需要 ， 替 你 安装 。 要 验 
证 安装 ， 就 运行 lein repl 来 检查 Clojure 的 版 本 : 

$ lein repl 

# ... 

User=> *clojure-version* 

{:major 1, :minor 5, :incremental 1, :qualifier nil} 





某 些 实例 在 GitHub 上 提供 了 一 些 在 线材 料 。 如 果 你 的 系统 上 没有 安装 Git， 
请 按照 安装 指南 (https://help.github.com/articles/set-up-git) 操作 ， 以 便 能 将 
GitHub 代码 库 签 出 到 本 地 。 














某 些 实例 (如 数据 库 实例 )， 需 要 进一步 安装 软件 。 在 这 种 情况 下 ， 实 例 将 包含 安装 工具 
的 额外 信息 。 
本 书 约定 


在 这 本 全 是 解决 方案 的 书 中 ， 你 会 发 现 其 中 有 不 少 代码 。Clojure 源 代码 使 用 等 宽 字 体 ， 
像 这 样 ; 





(defn add 
[x y] 
(+ x y)) 


如 果 Clojure 表达 式 被 求 值 并 返回 ， 该 值 将 以 注释 的 形式 给 出 ， 跟 在 一 个 箭头 后 面 ， 就 像 
它 出 现在 命令 行 中 一 样 : 


(add 1 2) 





| -> 


xvi 用 后 


3 3 -> 3 





在 合适 的 时 候 ， 代 码 示例 可 能 略 去 或 省 略 返回 值 注释 。 最 常见 的 两 种 情况 就 是 在 定义 函数 
/Var 时 和 缩短 较 长 的 输出 时 : 


;; 这 会 返回 #'user/one， 但 你 真 的 关心 吗 ? 
(def one 1) 














(into [] (range 1 20)) 
;; -> [1 2 ... 20] 


如 果 表 达 式 产生 输出 到 STDOUT 或 STDERR， 就 会 有 注释 说 明 (分 别 用 *out* 或 *error*)， 跟 
着 就 是 每 行 输出 的 注释 : 





(do (println "Hello!") 
(println "Goodbye!")) 

;; -> nil 

;; *Oout* 

;; Hello! 

;; Goodbye! 


REPL 会 话 

看 到 REPL 驱动 开发 目前 正在 流行 ， 因 此 本 书 就 成 为 了 REPL 驱动 的 。REPL ( 读 取 、 求 
值 、 打 印 、 循 环 ) 是 交互 式 的 提示 符 ， 对 表达 式 求 值 并 打印 出 结果 。Bash 提示 符 、irb 和 
python 提示 符 都 是 REPL 的 例子 。 本 书 中 几乎 每 个 实例 ， 都 是 为 在 Clojure REPL 中 运行 而 
设计 的 。 


虽然 Clojure REPL 传统 上 显示 为 user=> ...， 但 本 书 希 望 读 者 能 够 复制 粘贴 实例 中 所 有 的 
例子 ， 并 看 到 标示 的 结果 。 因 此 ， 例 子 中 省 略 了 user=> 并 以 注释 的 方式 给 出 了 输出 ， 让 事 
情 变 得 更 容易 。 如 果 你 在 计算 机 旁 ， 这 就 特别 有 帮助 : 只 要 复制 粘贴 代码 示例 ， 不 用 担心 
遇 到 不 能 执行 的 代码 。 





























如 果 例 子 只 适用 于 REPL 的 环境 ， 我 们 将 保留 传统 的 REPL 风格 〈 带 上 user=>)。 下 面 两 
个 例子 分 别 是 只 适用 于 REPL 的 例子 和 它 的 简化 版 本 。 








只 适用 于 REPL: 


user=> (+ 1 2) 

3 

user=> (println "Hello!") 
Hello! 

nil 


简化 版 本 : 


(+ 1 2) 





;; ->3 
(println "Hello!") 


;; *OUt* 
;; Hello! 


Cs 端 会 话 
控制 台 会 话 ( 例 如 ，shell 命令 ) 用 等 宽 字体 表示 ， 行 开始 的 美元 符号 ($) 表示 shell 提示 
ee 





$ lein version 
Leiningen 2.0.0-preview10 on Java 1.6.0_29 Java HotSpot(TM) 64-Bit Server VM 


命令 行 末 的 反 斜 杠 〈(\) 告诉 控制 台 ， 命 令 将 在 下 一 行 继续 。 











我 们 的 金 童 lein-try 

Clojure 不 以 它 的 扩展 标准 库 而 闻名 。 不 像 Perl 或 Ruby 这 样 的 语言 ，Clojure 的 标准 库 
相对 比较 小 。Clojure 选择 了 简单 和 强大 。 因 此 Clojure 是 一 种 有 许多 库 的 语言 ， 但 不 
是 内 建 的 库 (好 吧 ，Java 除外 ) 。 

为 本 书 中 这 么 多 解决 方案 都 依赖 于 第 三 方 库 ， 所 以 我 们 开发 了 lein-try (https:// 
github.com/rkneufeld/lein-try) 。Leiningen 是 Clojure 事实 上 的 项 目 工 具 ，Lein-try 
是 Leiningen (http://leiningen.org/) 的 一 个 小 插件 ， 让 你 快速 而 容易 地 尝试 各 种 
Clojure 库 。 

要 使 用 Lein-try， 请 确保 安装 了 Leiningen， 然 后 将 你 的 用 户 特性 描述 文件 (~/.lein/ 
profiles.clj) 编辑 成 下 面 的 样子 : 


{:user {:plugins [[lein-try "0.4.1"]]}} 


现在 ， 在 项 目 内 外 都 可 以 使 用 Lein try 命令 来 启动 REPL， 访 问 任何 你 喜欢 的 库 : 


$ lein try clj-time 


#. 
USer=> 

长 话 短 说 : 只 要 可 能 ， 在 用 第 三 方 库 的 实例 中 ， 你 会 看 到 要 求 执行 lein-try 命令 。 在 

3.4 节 中 ， lein-try 尝试 实例 的 例子 。 

如 果实 例 不 能 通过 lein-try 运行 ， 我 们 会 努力 提供 足够 的 指令 ， 说 明 如 何在 你 的 机 器 

上 运行 该 实 了 











排版 约定 


本 书 使 用 下 面 的 字体 约定 。 









































。 楷体 
新 术语 第 一 次 出 现时 使 用 楷体 ， 目 的 是 强调 。 
。 等 宽 字 体 
用 于 函数 名 、 方 法 名 和 参数 ， 用 于 数据 类 型 、 类 和 命名 空间 ， 在 例子 中 表示 输入 和 输 
出 ， 在 正则 文本 中 表示 字面 代码 。 
。 等 宽 黑 体 
用 于 表示 命令 ， 你 应 该 在 命令 行 中 照样 输入 。 

















。 < 可 取代 的 值 > 
路 径 、 命 令 、 函 数 名 中 的 元 素 ， 应 该 由 用 户 提供 的 值 来 取代 尖 括 号 及 其 中 的 内 容 。 








库 的 名 称 符合 两 种 惯例 之 一 : 具有 适当 名 称 的 库 用 普通 字体 (如 Hiccup 或 Swing)， 而 名 
称 与 代码 符号 相似 的 库 用 等 宽 字 体 (如 core.async 或 cLj-commons-exec ) 。 


这 个 符号 表示 提示 或 建议 。 


这 个 符号 表示 一 般 注 释 。 








使 用 代码 示例 


补充 材料 (代码 示例 、 练 习 等 ) 可 以 在 https://github.conmyclojure-cookbook/clojure-cookbook 
下 载 。 








本 书 的 目的 是 帮助 你 完成 工作 。 一 般 来 说 ， 如 果 示 例 代码 出 现在 本 书 中 ， 就 可 以 在 你 的 程 
序 和 文档 中 使 用 它 ， 不 需要 联系 我 们 获得 许可 ， 除 非 你 打算 复制 大 量 的 代码 。 例 如 ， 写 
一 个 程序 ， 用 到 本 书 中 的 几 段 代码 ， 不 需要 获得 许可 。 而 销售 或 分 发 OReilly 图 书 的 示例 























前 言 | xix 





CD-ROM， 确 实 需要 许可 。 回 答 问 题 时 摘录 本 书 并 引用 示例 代码 ， 不 需要 获得 许可 。 在 你 
的 产品 文档 中 包含 本 书 的 大 量 示例 代码 ， 则 确实 需要 许可 。 





我 们 感谢 你 说 明 来 源 ， 但 这 不 是 必须 的 。 来 源 说 明 通 常 包括 标题 、 作 者 、 出 版 商 和 ISBN。 
例如 :“Luke VanderHart 和 Ryan Neufeld 所 著 Clojure Cookbook (O’Reilly). Copyright 2014 
Cognitect, Inc., 978-1-449-36617-9.” 











如 果 你 觉得 你 对 代码 的 使 用 超出 了 合理 的 范围 或 上 述 允 许 的 情况 ， 可 随时 联系 我 们 : 


permissions @oreilly.com. 





Safari2 Books Online 


Safari Books Online (http://www.safaribooksonline.com) 是 应 运 而 生 的 数字 图 书馆 。 它 同 
时 以 图 书 和 视频 的 形式 出 版 世界 顶级 技术 和 商务 作家 的 专业 作品 。 技 术 专 家 、 软 件 开 发 人 
员 、Web 设计 师 、 商 务 人 士 和 创意 专家 等 ， 在 开展 调研 、 解 决 问题 、 学 习 和 认证 培训 时 ， 
都 将 Safari Books Online 视 作 获取 资料 的 首选 渠道 。 














于 组 织 团 体 、 政 府 机 构 和 个 人 ，Safari Books Online 提 


Gafarl 供 各 种 产品 组 合 和 灵活 的 定价 策略 。 用 户 可 通过 一 个 功能 


Books Online 完备 的 数据 库 检 索 系 统 访 问 O’Reilly Media、Prentice Hall 


Professional、Addison-Wesley Professional、 Microsoft Press、 





Sams、 Que、Peachpit Press、Focal Press、Cisco Press、 John Wiley & Sons、 Syngress、 
Morgan Kaufmann、 IBM Redbooks、Packt、Adobe Press、 FT Press、 Apress、 Manning、 
New Riders、McGraw-Hill、Jones 作 Bartlett、Course Technology 以 及 其 他 几 十 家 出 版 社 的 
上 千 种 图 书 、 培 训 视频 和 正式 出 版 之 前 的 书稿 。 要 了 解 Safari Books Online 的 更 多 信息 ， 
我 们 网 上 见 。 


联系 我 们 
请 把 对 本 书 的 意见 和 疑问 发 送 给 出 版 社 。 


美国 : 
O’Reilly Media, Inc. 
1005 Gravenstein Highway North 
Sebastopol, CA 95472 


中 国 : 
北京 市 西城 区 西直门 南大 街 2 号 成 铭 大 厦 C 座 807 室 (100035) 
奥 菜 利 技术 咨询 (北京) 有限 公司 














-> 


xx | 前 言 


O’Reilly 的 每 一 本 书 都 有 专属 网 页 ， 你 可 以 在 那儿 找到 本 书 的 相关 信息 ， 包 括 勘 误 表 、 





例 代码 以 及 其 他 信息 。 


http://oreil.ly/clojure- 


本 书 的 网 站 地 址 是 : 
ckbk 





对 于 本 书 的 评论 和 技术 性 问题 ， 请 发 送 电 子 邮件 到 : bookquestions@oreilly.com 





要 了 解 更 多 O’Reilly 图 





书 、 培 训 课程 、 会 议和 新 闻 的 信息 ， 请 访问 以 下 网 站 : 





http://www.oreilly.com 


我 们 在 Facebook 的 地 二 





止 如 下 : http://facebook.com/oreilly 


请 关注 我 们 的 Twitter 动态 : http://twitter.com/oreillymedia 


我 们 的 YouTube 视频 地 址 如 下 : http://www.youtube.com/oreillymedia 


致谢 


这 


如 果 没 有 Clojure 社区 中 许多 人 的 无 私 奉献 ， 本 书 不 可 能 写成 。 超 过 65 个 Clojure 开发 者 





响应 号 召 ， 提 交 实 例 ， 





























的 书 ， 我 们 只 是 很 荣幸 能 够 将 内 容 组 织 到 一 起 。 这 些 贡献 者 是 : 


。 Adam Bard，adambard on GitHub 
。 Alan Busby，thebusby on GitHub 
。 Alex Miller, puredanger on GitHub 


。 Alex Petrov, ifesdje 


en on GitHub 


。 Alex Robbins, alexrobbins on GitHub 
。 Alex Vzorov, Orca on GitHub 


。 Ambrose Bonnaire-S 


。 arosequist 


ergeant, frenchy64 on GitHub 


。 Chris Allen, bitemyapp on GitHub 


。 Chris Ford, ctford o 


n GitHub 


。 Chris Frisz, cjfrisz on GitHub 


。 Clinton Begin, cbegin on GitHub 
。 Clinton Dreisbach, cndreisbach on GitHub 


。 Colin Jones, trptcolin on GitHub 


。 Craig McDaniel, cpmcdaniel on GitHub 


。 Daemian Mack, daemianmack on GitHub 


。 Dan Allen, mojavelinux on GitHub 


。 Daniel Gregoire, semperos on GitHub 


。 Dmitri Sotnikov, yogthos on GitHub 


审读 ， 并 为 本 书 的 方向 提供 了 建议 。 归 根 到 底 ， 这 是 一 本 属于 衬 





上 区- 











Edmund Jackson, ejackson on GitHub 

Eric Normand, ericnormand on GitHub 
Federico Ramirez, gosukiwi on GitHub 
Filippo Diotalevi, fdiotalevi on GitHub 
fredericksgary 

Gabriel Horner, cldwalker on GitHub 

Gerrit, gerritjvv on GitHub 

Guewen Baconnier, guewen on GitHub 
Hoing Minh Thing, myguidingstar on GitHub 
Jason Webb, bigjason on GitHub 

Jason Wolfe, wOlfe on GitHub 

Jean Niklas L orange，hyPiRion on GitHub 
Joey Yang，joeyyang on GitHub 

John Cromartie, jcromartie on GitHub 

John Jacobsen, eigenhombre on GitHub 
John Touron, jwtouron on GitHub 

Joseph Wilk, josephwilk on GitHub 
jungziege 

jwhitlark 

Kevin Burnett，burnettk on GitHub 

Kevin Lynagh, lynaghk on GitHub 

Lake Denman, ldenman on GitHub 
Leonardo Borges, leonardoborges on GitHub 
Mark Whelan, mrwhelan on GitHub 

Martin Janiczek, Janiczek on GitHub 
Matthew Maravillas, maravillas on GitHub 
Michael Fogus, fogus on GitHub 

Michael Klishin, michaelklishin on GitHub 
Michael Mullis, mmullis on GitHub 

Michael O’*Church, michaelochurch on GitHub 
Mosciatti S., siscia on GitHub 

nbessi 

Neil Laurance, toolkit on GitHub 

Nurullah Akkaya, nakkaya on GitHub 
Osbert Feng, osbert on GitHub 

Prathamesh Sonpatki, prathamesh-sonpatki on GitHub 
R. T. Lechow, rtlechow on GitHub 





。 Ravindra R. Jaju, jaju on GitHub 

。 Robert Stuttaford, robert-stuttaford on GitHub 
。 Russ Olsen, russolsen on GitHub 

。 Ryan Senior, senior on GitHub 

。 Sam Umbach, sumbach on GitHub 

。 Sandeep Nangia, nangia on GitHub 

。 Steve Miner, miner on GitHub 

。 Steven Proctor, stevenproctor on GitHub 
。 temacube 

。 Tobias Bayer, codebrickie on GitHub 

。 Tom White，dribnet on GitHub 

。 Travis Vachon, travis on GitHub 


。 Stefan Karlsson, zclj on GitHub 


最 大 的 贡献 者 值得 特别 感谢 : Adam Bard、Alan Busby、Alex Robbins、Ambrose Bonnaire- 
Sergeant、 Dmitri Sotnikov、 John Cromartie、 John Jacobsen、 Robert Stuttaford、Stefan 


Karlsson 和 Tom Hicks。 这 些 杰 出 的 开发 者 一 起 几乎 贡献 了 本 书 三 分 之 一 的 实例 。 


感谢 我 们 的 技术 复查 者 Alex Robbins、Travis Vachon 和 Thomas Hicks。 在 大 约 11 个 小 时 
或 更 短 的 时 间 内 ， 这 几 位 先生 查 遍 了 本 书 ， 寻 找 技术 错误 。 普 通 的 技术 复查 者 只 会 提交 文 
本 的 问题 描述 ， 这 几 位 则 做 得 更 多 ， 常 常 提交 拉 取 请 求 (pull request) ， 修 复 了 他 们 报告 的 
所 有 错误 。 总 之 ， 和 他 们 一 起 工作 很 开心 ， 因 为 他 们 的 参与 ， 本 书 变 得 好 了 很 多 。 


最 后 ， 感 谢 我 们 的 雇主 Cognitect， 让 我 们 有 时 间 完 成 本 书 ， 同 时 感谢 所 有 的 同事 ， 他 们 提 
出 了 建议 和 反馈 ， 而 且 最 棒 的 是 ， 他 们 提供 了 更 多 的 实例 ! 

















Ryan Neufeld 

首先 ， 非 常 感谢 Luke， 是 他 最 先 提出 了 这 本 书 的 主意 。 我 非常 感激 他 赣 请 我 加 入 ， 一 起 编 
写 。 人 们 说 学 习 某 样 东西 最 好 的 方法 就 是 写 一 本 关于 它 的 书 ， 此 言 不 虚 。 编 写 这 本 书 确实 
丰富 了 我 的 Clojure 技能 ， 使 我 的 水 平 提升 到 了 另 一 个 层次 。 

而 且 最 重要 的 是 ， 我 要 感谢 家 人 ， 他 们 容忍 我 完成 写 书 的 过 程 。 让 这 件 事 顺利 起 步 是 无 比 
艰巨 的 任务 ， 没 有 妻子 Jackie 和 女儿 Elody 的 爱 和 支持 ， 这 不 可 能 完成 。 如 果 不 是 侵占 了 
她 们 无 数 的 夜晚 、 周 末 和 休假 时 间 ， 我 不 可 能 编写 完 这 本 书 。 



































Luke VanderHart 
首先 ， 我 要 感谢 合 著者 Ryan， 他 工作 非常 努力 ， 参 与 编写 了 这 本 书 。 








同时 ， 我 在 Cognitect 的 同事 提供 了 许多 想法 和 思路 ， 最 重要 的 是 有 一 个 很 好 的 委员 会 ， 探 





讨 在 编写 和 编辑 过 程 中 出 现 的 许多 问题 。 非 常 感谢 他 们 ， 同 时 也 感谢 他 们 提供 机 会 ， 让 我 





整 天 写 Clojure 代码 ， 天 天 如 此 。 





玫 
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XXiv 


第 1 章 


原生 数据 





1.0 简介 


对 于 处 理 困 难 的 问题 ，Clojure 是 一 门 极 好 的 语言 。 它 的 简单 工具 让 软件 开发 者 一 层 一 层 
地 建立 抽象 ， 直 到 能 够 轻松 地 处 理 世 界 上 最 难 的 一 些 问题 。 像 化 学 一 样 ， 每 个 了 不 起 的 
Clojure 程序 都 归结 为 简单 的 原子 ， 即 原生 类 型 。 
































很 久 以 前 ，Clojure 就 站 在 Java 巨人 的 肩 上 ， 它 利用 了 Java 虚拟 机 (JVM)“ 中 提供 的 一 组 
极 好 的 类 型 ， 这 些 类 型 经 过 了 实践 的 检验 : 字符 串 、 数 值 类 型 、 日 期 、 通 用 唯一 标识 符 
(UUID)， 只 要 说 得 出 的 ，Clojure 都 有 。 本 章 探讨 Clojure 的 原生 类 型 ， 以 及 如 何 完成 常见 
任务 。 


字符 串 
几乎 所 有 编程 语言 都 知道 如 何 处 理 字符 串 ，Clojure 也 不 例外 。 除 了 一 些 差别 之 外 ，Clojure 
提供 了 像 大 多 数 其 他 语言 一 样 的 能 力 。 下 面 是 一 些 应 该 了 解 的 关键 差别 。 


首先 ，Clojure 字符 串 基 于 Java 的 UTF-16 字符 串 。 不 需要 在 文件 中 添加 注释 来 说 明 字符 串 
的 编码 方式 ， 也 不 需要 担心 在 转换 过 程 中 丢失 了 字符 。Clojure 程序 已 经 准备 好 与 英文 字符 
之 外 的 世界 通信 。 



































注 1: JVM 是 执行 Java 字 节 码 的 地 方 。Clojure 编译 器 以 JVM 为 目标 ， 生 成 能 运行 的 字 节 码 。 因 此 ， 你 可 
以 任意 使 用 所 有 原生 Java 类 型 。 


























其 次 ，Clojure 不 像 Perl 或 Ruby 拥有 较 大 的 字符 串 程 序 库 ， 其 内 建 的 字符 串 操作 库 相 当 精 
练 。 初 看 起 来 这 可 能 有 点 奇怪 ， 但 Clojure 喜欢 简单 的 、 可 组 合 的 工具 ，Clojure 中 有 许多 
集合 操作 函数 ， 都 能 很 好 地 处 理 字符 串 ， 因 为 它们 也 是 集合 ! 由 于 这 个 原因 ，Clojure 的 字 
符 串 库 小 得 出 人 意料 。 在 clojure.string 命名 空间 中 ， 可 以 找到 很 小 一 组 专门 针对 字符 串 
的 函数 。 


Clojure 也 利用 了 它 的 宿主 平台 (JVM)， 没 有 重复 java.lang.String 类 已 实现 的 功能 。 在 
Clojure 中 使 用 Java 互 操 作 并 不 是 一 种 失败 的 尝试 ， 因 为 语言 的 设计 就 是 为 了 便于 互 操作 ， 
使 用 内 建 的 字符 串 方 法 通常 和 调用 Clojure 的 函数 一 样 方便 。 















































我 们 建议 在 必要 的 时 候 , “require as”clojure.string 命名 空间 。 宣 目地 :use 一 个 命名 空 
间 总 是 令 人 气 恼 的 *， 常 常 导致 冲突 或 混乱 。 所 以 我 们 更 喜欢 给 它 取 别名 为 str 或 s， 而 非 
在 所 有 东西 前 面 加 上 ctLojure.string， 那 有 点 奇怪 : 











(require '[clojure.string :as str]) 


(str/blank? "") 
;; -> true 


数值 类 型 

对 于 数值 类 型 ，Clojure 和 Java 之 间 的 差异 比较 大 。 但 这 不 一 定 是 坏事 。 虽然 Java 的 数值 
类 型 可 能 非常 快 或 具有 任意 的 精度 ， 但 数值 整体 上 没有 一 组 精美 的 接口 。Clojure 把 Java 
的 各 种 数值 类 型 统一 成 为 一 致 的 包 ， 每 个 困难 的 地 方 都 有 解决 的 办 法 。 

本 章 中 关于 数值 类 型 的 实例 ， 将 展示 如 何 利 用 这 些 设 计 ， 实 现 期 望 的 速度 、 精 度 或 表达 


合 忆 
HE o 


日 期 


在 Java 生态 系统 中 ， 日 期 和 时 间 的 历史 长 而 曲折 。 需 要 Date、Time、DateTime 或 Calendar 
吗 ? 谁 知道 呢 。 为 什么 这 些 API 都 那么 不 稳定 ?本 章 中 的 实例 应 该 能 够 阐明 何 时 使 用 恰当 
的 内 建 类 型 ， 如 何 使 用 ， 以 及 若 内 建 类 型 不 够 用 (或 者 非常 难 用 )， 何 时 去 寻找 外 部 库 。 


1.1 改变 字符 串 的 大 小 写 


作者 : Ryan Neufeld 


























i 




















注 2: 用 了 use， 就 在 项 目的 命名 空间 中 引入 了 许多 新 的 符号 ， 又 没有 留 下 线索 表明 它们 来 自 哪里 。 这 通常 
让 代码 维护 者 感到 困惑 和 诅 丧 。 我 们 强烈 建议 不 要 用 use。 
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问题 
需要 改变 一 个 字符 串 的 大 小 写 。 


解决 方案 


用 clojure.string/capitalize 来 大 写字 符 串 中 的 第 一 个 字符 。 





(clojure.string/capitalize "this is a proper sentence.") 
;; -> "This is a proper sentence." 


如 果 需 要 改变 所 有 字符 的 大 小 写 ， 请 用 clojure.string/lower-case 或 clojure.string/ 


Upper-case: 


(clojure.string/upper-case "Loud noises!") 
;; -> "LOUD NOISES!" 


(clojure.string/lower-case "COLUMN_HEADER_ONE") 
;; -> "column_header_one" 


讨论 
大 小 写 函 数 只 影响 字母 。 虽 然 函数 capitalize、lower-case 和 upper-case 可 能 会 改动 字 


母 , 但 标点 符号 或 数字 会 保持 不 变 : 


(clojure.string/lower-case "!&$#@#%^[]") 
;; -> "!&$#@#%^[]" 








Clojure 对 所 有 字符 串 都 使 用 UTF-16 编码 ， 因 此 它 对 什么 是 字母 的 定义 是 相当 宽泛 的 ， 包 
括 有 重音 的 字母 。 例 如 短 句 “Hurry up, computer!”， 它 包含 字母 e， 翻 译 成 法 语 时 会 有 锐 
音 (6) 和 长 音 (6) 记号 。 由 于 这 些 特殊 的 字符 都 被 视 为 字母 ， 大 小 写 国 数 可 以 对 它们 进 
行 相应 的 改变 : 





(clojure.string/upper-case "Dépéchez-vous, l'ordinateur!") 
;; -> "DEPECHEZ-VOUS, L'ORDINATEUR!" 


阅 
clojure.string 命名 空间 的 API 文档 (http:/clojure.github.io/clojure/clojure.string-api.html) 。 
java.tLang.String 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/lang/String.html) 。 


1.2 清除 字符 串 中 的 空白 字符 


作者 : Ryan Neufeld 


. . Ny 
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解决 方案 
使 用 clojure.string/trinm 函数 来 删除 字符 串 首尾 的 所 有 空白 字符 : 


(clojure.string/trim " \tBacon ipsum dolor sit.\n") 
;; -> "Bacon ipsum doLor sit." 








要 处 理 字符 串 内 部 的 空白 字符 ,需要 有 点 创造 性 。 使 用 clojure.string/replace 来 修正 字 
符 串 内 部 的 空白 字符 ， 
;; 将 空白 字符 压缩 为 一 个 空格 


(clojure.string/replace "Who\t\nput all this\fwhitespace here?" #"\s+" " ") 
;; -> "Who put all this whitespace here?" 














;; 将 Windows 风格 的 换行 替换 成 Unix 风格 的 换行 
(clojure.string/replace "Line 1i\r\nLine 2" "\r\n" "\n") 
;; -> "Line 1i\nLine 2" 


讨论 

什么 构成 了 Clojure 中 的 空白 字符 ?回答 取决 于 功能 ，、 有 些 比 另 一 些 更 自由 ， 但 可 以 放心 
地 假定 空格 〈 )、 制 表 符 (\t)、 换 行 (\n)、 回 车 (\r)、 走 行 (\f) 和 垂直 制 表 符 〈\xoB) 
都 会 被 当成 空白 字符 。 在 Java 的 正则 表达 式 实 现 中 ， 这 一 组 字符 由 \s 匹配 。 






































Ruby 和 其 他 语言 将 字符 串 操 作 函 数 放 在 核心 命名 空间 ，Clojure 不 同 ， 它 将 clojure. 
string 命名 空间 放 在 clojure.core 之 外 ， 因 此 不 能 够 直接 使 用 。 常 用 的 技巧 是 将 clojure. 
string 引入 为 str 或 string 这 样 的 简写 形式 ， 让 代码 更 简明 : 








(require '[clojure.string :as str]) 
(str/replace "Look Ma, no hands" "hands" "long namespace prefixes") 
;; -> "Look Ma, no long namespace prefixes" 








有 时 候 ， 也 许 不 需要 把 字符 串 两 边 的 空白 字符 都 删 掉 。 如 果 只 是 想 删 除 字符 串 左 边 或 右边 
的 空白 字符 ， 请 分 别 使 用 clojure.string/triml 或 clojure.string/trimr。 


(clojure.string/triml " Column Header\t") 
;; -> "Column Header\t" 


(clojure.string/trimr "\t\t* Second-level bullet.\n"), 
;; -> "\t\t* Second-level bullet." 


参阅 
。 1.3 节 “ 利 用 部 件 构建 字符 串 ”。 








| 大 


第 1 章 


1.3 利用 部 件 构建 字符 串 


作者 : Ryan Neufeld 
问题 
有 多 个 字符 串 、 值 或 集合 ， 需 要 合并 成 一 个 字符 串 。 


解决 方案 
使 用 str 函数 来 连接 多 个 字符 串 和 (或 ) 








全 











(str "John" mh "Doe") 
;; -> "John Doe" 





;; str 也 适用 于 变量 ,或 其 他 任何 值 
(def first-name "John") 

(def Last-name "Doe") 

(def age 42) 





(str last-name ", " first-name " - age: " age) 
;; -> "Doe, John - age: 42" 


使 用 apply 带 str， 将 值 的 集合 连接 成 一 个 字符 串 : 


;将 一 系列 字符 还 原 成 一 个 字符 串 
(apply str "ROT13: " [\W \h \y \v \h \f \ \P \n \r \f \n \e]) 
;; -> "ROT13: Whyvhf Pnrfne" 


;; 或 者 将 一 些 行 还 原 成 一 个 文件 (如 果 行 都 有 换行 符 ) 

(def Lines ["#! /bin/bash\n", "du -a ./ | sort -n -r\n"]) 
(apply str lines) 

;; -> "#! /bin/bash\ndyu -a ./ | sort -n -r\n" 


讨论 

Clojure 的 str 就 像 一 个 好 的 Unix 工具 : 它 做 一 件 事 ， 做 得 很 好 。 如 有 果 向 str 提供 一 个 或 
多 个 参数 ， 它 会 对 参数 调用 Java 的 .toString() 方法 ， 将 每 个 结果 加 在 后 面 。 如 果 提 供 
nil 作为 参数 或 不 带 参数 调用 ，str 会 返回 代表 字符 串 身 份 的 值 ， 即 空 串 。 























对 于 字符 串 连 接 ，Clojure 采用 了 相当 自由 的 方式 。(appLy str .…) 没有 什么 专门 针对 字 
符 串 的 东西 。 它 只 是 使 用 了 高 阶 函 数 appty， 模 拟 用 变 长 参数 调用 str。 











这 个 apply: 
(apply 沁 让 ["a" np "ery 


在 功能 上 等 价 于 : 
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(str "a" "b" "er) 














既然 Clojure 在 连接 字符 串 时 没有 什么 限制 ， 我 们 就 可 以 自由 发 挥 ， 利 用 Clojure 提供 的 大 
量 操 作 函 数 。 例 如 ， 从 一 行 抬头 和 几 行 数据 中 构造 辟 号 分 隔 的 值 (CSV)。 这 个 例子 特别 
适合 appLy， 因 为 可 以 在 前 面 加 上 抬头 ， 不 用 将 它 播 在 rows 集合 的 前 面 : 



































;; 利用 一 行 抬 头 字 符 串 和 几 行 数据 来 构造 CSV 
(def header "first_name,Last_name,empLoyee_numberNn'") 
(def rows ["luke,vanderhart,1","ryan,neufeld,2"]) 


(apply str header (interpose "\n" rows)) 
;; -> "first_name,last_name,employee_number\nluke,vanderhart,1\nryan,neufeld,2" 





如 果 要 做 的 事情 不 是 太 特 别 ，apply 和 interpose 可 能 有 些 繁琐。 要 连接 简单 的 字符 串 ， 通 
常用 clojure.string/join 更 容易 。join 国 数 接受 一 个 集合 和 一 个 可 选 的 分 隔 符 。 带 分 隔 
符 时 ，join 返回 的 字符 串 是 集合 的 所 有 元 素 ， 中 间 用 该 分 隔 符 分 隔 。 不 带 分 隔 符 时 ， 它 返 
回 所 有 元 素 挤 在 一 起 的 字符 串 ， 类 似 于 (apply str coll) 的 返回 : 











(def food-items ["milk" "butter" "flour" "eggs"]) 
(clojure.string/join ", " food-items) 
;; -> "milk, butter, flour, eggs" 


(clojure.string/join [1 2 3 4]) 
;; -> "1234" 


阅 

1.6 节 “ 格 式 化 字符 串 "。 

。 clojure.string 命名 空间 的 API 文档 〈http:/clojure.github.io/clojure/clojure.string-api.html) 。 
。 java.lang.String 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/lang/String.html) 。 


1.4 ”将 字符 串 作为 字符 序列 


作者 : Ryan Neufeld 


Wh 





问题 
需要 处 理 字符 串 中 的 单个 字符 。 


解决 方案 


对 字符 串 使 用 seq， 得 到 它 包 含 的 字符 序列 : 








(seq "Hello, world!") 
;; -> (\H \e \U \L \o \, \space Ww \o \r \L \d \!) 
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但 是 ， 并 非 每 次 想 处 理 字符 串 中 的 字符 时 ， 都 要 调用 seq。 以 序列 为 参数 的 所 有 函数 ， 都 
会 自动 将 字符 串 强 制 转换 成 字符 序列 : 


;; 计算 每 个 字符 在 字符 串 中 出 现 的 次 数 
(frequencies (clojure.string/lower-case "An adult all about A's")) 
33 -> {\space 4， \a 5， \b 1， \d 1， \ 1， \L 3 \n 1， \o 1， \s 1， \t 2， Nu 2} 























;; 字符 串 中 的 每 个 字母 都 是 大 写 的 吗 ? 
(defn yelling? [s] 
(every? #(or (not (Character/isLetter %)) 
(Character/isUpperCase %)) 
s)) 


(yelling? "LOUD NOISES!") 
;; -> true 


(yelling? "Take a DEEP breath.") 
;; -> false 


讨论 
在 计算 机 科学 中 ,“ 字 符 串 ”意味 着 “字符 序列 ”，Clojure 对 字符 串 就 是 这 么 处 理 的 。 因 为 
Clojure 字符 串 背 后 就 是 字符 序列 ， 所 以 在 需要 集合 的 地 方 ， 都 可 以 用 字符 串 替 代 。 如 果 这 
样 做 。 字符 由 对 会 补 解 种 为 “个 字 符 集合 。(seq string) 没有 什么 特别 的 。seq 函数 只 是 

一 个 字符 集合 的 序列 ， 这 些 字符 组 成 了 这 个 字 符 串 。 




















更 常见 的 是 ， 在 对 字符 串 中 的 字符 做 了 某 种 工作 之 后 ， 希 望 将 这 个 集合 恢复 成 一 个 字符 
ee 


恕 


(apply str [\H \e ML ML \o \, \space \w \o \r \L \d \!]) 
;; -> "Hello, world!" 








1.3 市 “利用 部 件 构 建 字符 串 ”。 
1.5 市 “字符 与 整数 的 转换 ”。 


1.5 ”字符 与 整数 的 转换 


作者 : Ryan Neufeld 





. . NS 
Em 


问题 
需要 将 字符 转换 成 对 应 的 Unicode 编码 值 (整数 值 ) ， 或 反 过 来 。 
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解决 方案 
用 int 函数 将 字符 转换 成 它 的 整数 值 ; 

















(int \a) 
;; -> 97 


(int \g) 
;; -> 248 


(int \a) ; 希腊 字母 aLpha 
;; -> 945 


(int \u03B1) ; 希腊 字母 aLpha ( 按 编码 值 ) 
;; -> 945 


(map int "Hello, world!") 
;; -> (72 101 108 108 111 44 32 119 111 114 108 100 33) 


用 char 函数 返回 整数 编码 值 对 应 的 字符 : 


(char 97) 
;; -> \a 


(char 125) 
2 AN 


(char 945) 
;; -> \a 


(reduce #(str %1 (char %2)) 


[115 101 99 114 101 116 32 109 101 115 115 97 103 101 115]) 
;; -> "secret messages" 


讨论 
Clojure 继承 了 JVM 强大 的 Unicode 支持 。 所 有 字符 串 都 是 UTF-16 字符 串 ， 所 有 字符 都 是 
Unicode 字符 。 前 面 256 个 Unicode 编码 值 与 ASCII 码 相 等 ， 这 很 方便 ， 让 标准 的 ASCII 
文本 很 容易 处 理 。 但 是 ，Clojure 像 Java 一 样 ， 没 有 对 ASCII 码 进行 任何 特殊 处 理 ， 字 符 
和 整数 之 间 的 一 一 对 应 表明 ， 编 码 值 直 接 延 伸 到 整个 Unicode 空间 。 
























































例如 ， 表 达 式 (map char (range 0x0410 0x042F)) 列 出 所 有 的 斯 拉夫 语 大 写字 母 ， 它 们 处 
于 Unicode 的 这 个 范围 : 














(\A\B\B\T \I\E \X\3 \H \H \K \T \M \H MONMI AP \C \T \Y \ 
\X \I \H \H AU \P MPI \P \9 \I0) 


char 和 int 函数 的 主要 用 处 ， 是 将 一 个 数字 强制 转换 成 java.Lang.Integer 或 java.lang. 
Character 的 实例 。Integer 和 Character 最 终 都 是 数字 编码 的 ， 尽 管 Character 还 支持 一 
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些 额 外 的 文本 相关 方法 ， 要 先 转换 成 真正 的 数字 类 型 ， 才 能 用 于 数学 表达 式 。 


. ND 
| 


Unicode Explained (http://oreil.ly/unicode-explained)， 作 者 Jukka K. Korpela (O’Reilly)， 

真正 全 面 地 探讨 了 Unicode 和 国际 化 的 工作 原理 。 
。 1.4 节 “ 将 字符 串 作 为 字符 序列 "， 详 细 讨 论 了 处 理 构成 字符 串 的 字符 。 
。 1.15 市 “解析 数字 ”。 


1.6 格式 化 字符 串 


作者 : Ryan Neufeld 

















问题 
需要 在 字符 串 中 插入 一 些 值 ， 并 设 定 这 些 值 在 字符 串 中 出 现 的 格式 。 


解决 方案 


将 值 格式 化 后 插入 字符 串 的 最 快 方法 ， 是 str 函数 : 





























(def me {:first-name "Ryan", :favorite-language "Clojure"}) 
(str "My name is " (:first-name me) 

", and I really like to program in " (:favorite-language me)) 
;; -> "My name is Ryan, and I really like to program in Clojure" 


(apply str (interpose " " [1 2.000 (/ 3 1) (/ 4 9)])) 
;; -> "1 2.0 3 4/9" 


但 使 用 str 时 ， 值 的 插入 是 不 加 思考 的 ， 以 默认 的 .toString() 方式 显示 。 不 仅 如 此 ， 有 
时 候 看 着 str 的 格式 ， 很 难 解释 想 要 的 输出 是 什么 。 


要 更 好 地 控制 这 些 值 的 显示 方式 ， 请 用 format 函数 : 
;; 产生 一 个 文件 名 ， 带 有 9 补 全 的 可 排序 的 索引 


(defn filename [name i] 
(format "%03d-%s" i name)) ; O@ 














(filename "my-awesome-file.txt" 42) 
;; -> "042-my-awesome-file.txt" 


;; 创建 一 个 对 齐 的 表格 
(defn tableify [row] 
(apply format "%-20s | %-20s | %-20s" row)) ; @ 


(def header ["First Name", "Last Name", "Employee ID"]) 
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(def employees [["Ryan", "Neufeld", 2] 
["Luke", "Vanderhart", 1]]) 


(->> (concat [header] employees) 
(map tableify) 
(mapv println)) 


“OULtR 

;; First Name | Last Name | Employee ID 
;; Ryan | Neufeld 12 

;; Luke | Vanderhart I1 


@ 0 标记 表明 为 数字 补 上 零 (这 里 是 3 个 数字 )。 
@ -标记 表明 字符 串 (s) 左 对 齐 ， 最 小 宽度 为 20 个 字符 。 


讨论 

要 在 字符 串 中 插入 值 ， 有 两 种 不 同 的 选择 : 可 以 用 str， 这 种 方法 很 方便 ， 但 难以 控制 值 
的 显示 ; 也 可 以 使 用 format， 它 可 以 精细 控制 值 的 显示 方法 ， 但 需要 了 解 C 和 Java 风格 
的 格式 化 字符 串 。 归 根 结 底 ， 采 用 的 工具 或 复杂 程度 应 该 符合 当前 任务 的 需求 : 如 果 值 的 
默认 格式 足够 ， 就 使 用 str。 如 果 需 要 对 值 的 显示 有 更 多 控制 ， 就 使 用 format。 
























































格式 字符 串 


传 给 format 的 第 一 个 参数 就 是 所 谓 的 格式 字符 串 。 这 些 字 符 串 的 文法 不 是 Clojure 新 
创 或 独 有 的 ， 其 至 也 不 应 归功 于 Java， 它 们 实际 上 来 自 C 的 printf 函数 。Clojure 的 
format 汤 数 使 用 了 Java 的 String/format， 它 实现 了 printf 风格 的 值 替 换 。 


格式 字符 囊 是 一 个 正常 的 字符 囊 ， 其 中 说 入 了 任意 数量 的 格式 指定 符 。 格 式 指定 符 是 
一 个 占 位 符 ， 稍 后 将 由 值 取代 。 最 简单 的 形式 是 后 跟 一 个 类 型 指定 字符 。 例 如 ，% 
是 指 整 数 (d 表示 数字 ) ，%f 表示 浮 点 数 。 除 了 字符 囊 、 整 数 和 浮 点 数 的 指定 字符 ， 还 
有 字符 、 日 期 和 不 同 进 制 的 数字 (8 进 制 和 16 进 制 ) 等 。 


这 些 格式 指定 符 的 特殊 之 处 在 于 ， 可 以 在 多 和 类 型 指定 字符 之 间 桂 入 任意 多 的 标记 和 
选项 。 例 如 ,，“%-10s” 表 明 提 供 的 字符 囊 (s) 应 该 左 对 齐 〈-)， 总 的 最 小 宽度 是 10。 
“%97.3f” 将 一 个 数 变 成 0 补 齐 的 数 ， 有 7 个 字符 帘 ， 包 括 3 个 小 数位 〈 就 像 杜 威 十 进 
制 系统 中 使 用 的 数 ) : 


(format "%07.3f" 0.005) 
;; -> "000.005";; 计算 机 编程 .程序 和 数据 书籍 的 杜威 十 进 制 分 类 

















要 了 解 格 式 化 字符 囊 的 更 多 内 容 ， 请 查看 java.util.Formatter 的 API 文档 (http:/ 
docs.oracle.com/javase/7/docs/api/java/util/Formatter.html) 。 











参阅 
。 1.3 节 “ 利 用 部 件 构建 字符 串 ”。 
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。 1.28 市 “利用 cUj-time 格式 化 日 期 ”。 


1.7” 按 异 式 查找 字符 串 


作者 : Ryan Neufeld 


问题 
需要 测试 一 个 字符 串 ， 看 看 它 的 组 成 部 分 是 否 符 合 一 个 模式 。 


解决 方案 
要 检查 字符 串 中 是 否 存在 一 个 模式 ， 请 用 re-find， 参 数 是 期 望 的 模式 和 要 检查 的 字符 串 。 
用 正则 表达 式 来 表示 期 望 的 模式 (如 “foo” 或 “\d+”) : 

;; 所 有 连 纪 卖 的 数字 


(re-find #"\d+" "I've just finished reading Fahrenheit 451") 
;; -> "451" 




















(re-find #"Bees" "Beads aren't cheap.") 

;; -> niL 
讨论 
要 检查 字符 串 是 否 包含 一 个 模式 ，re-find 非常 方便 。 它 以 正则 表达 式 模式 和 字符 串 为 参 
数 ， 返 回 模式 的 第 一 个 匹配 或 nil。 


如 果 条 件 更 严格 ， 要 求 整 个 字符 串 匹 配 一 个 模式 ， 请 使 用 re-matches。 它 和 re-find 不 一 
样 ， 不 是 匹配 字符 串 的 任意 部 分 ， 而 是 仅 匹配 整个 字符 串 。 





;; 在 find 中 ，#"\w+" 是 任何 连续 的 单词 字符 
(re-find #"\w+" "my-param") 
;，-> "my" 


;; 但 在 matches 中 ，#"\w+" 意味 着 "全 是 单词 字符 " 
(re-matches #"\w+" "my-param") 
;; -> Nil 

















(re-matches #"\w+" "justLetters") 
;; -> "justLetters" 


. 沙 
Em 


java.lang.Pattern 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/util/regex/Pat 
tern.html) ， 其 中 定义 了 Java 支持 的 正则 表达 式 语法 (Clojure 的 正则 表达 式 一 样 ) 。 
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WE 


。 1.8 节 人 禾 
。 1.9 方 “ 对 字符 串 执 行 查 找 和 替换 ”。 


1.8 利用 正则 表达 式 从 字符 串 中 取出 值 


作者 : Ryan Neufeld 


问题 
需要 提取 匹配 指定 模式 的 字符 串 部 分 。 


解决 方案 








用 正则 表达 式 从 字符 串 中 取出 值 ” ,探讨 了 利用 正则 表达 式 从 字符 串 中 提取 值 。 


使 用 re-seq， 参 数 是 一 个 正则 表达 式 模 式 和 一 个 字符 串 ， 得 到 一 系列 连续 的 匹配 : 


;; 从 句子 中 提取 简单 的 单词 
(re-seq #"\w+" "My Favorite Things") 
;; -> ("My" "Favorite" "Things") 

















;; 提取 简单 的 7 位 电话 号 码 
(re-seq #"\d{3}-\d{4}" "My phone number is 555-1234.") 
;; -> ("555-1234") 








带 有 匹配 组 (括号 ) 的 正则 表达 式 将 返回 一 个 向 量 ， 包 含 所 有 的 完全 匹配 : 
;; 提取 所 有 的 Twitter 用 户 名 和 # 标 签 


(defn mentions [tweet] 
(re-seq #"(@|#)(\w+)" tweet)) 

















(mentions "So long, @earth, and thanks for all the #fish. #goodbyes") 


;; -> (["@earth" "@" "earth"] ["#fish" "#" "fish"] ["#goodbyes" "A" "goodbyes"]) 


讨论 
提供 一 个 简单 的 模式 (没有 匹配 组 的 )，re-seq 会 返回 一 系列 的 匹配 。 这 是 


惰性 匹配 ， 充 


分 体现 了 Clojure 的 强大 。 对 一 个 巨大 的 字符 串 调用 re-seq 时 ， 不 会 马上 扫描 整个 字符 串 ， 











可 以 增 量 式 地 处 理 这 些 值 ， 或 者 将 计算 工作 推迟 到 应 用 程序 后 面 的 部 分 。 











ei a ei re-seq 的 做 法 就 有 点 不 一 样 。 不 要 担心 ， 结 果 序 列 














寸 其 值 将 是 向 量 ， 而 非 单调 的 字符 串 。 向 量 的 第 一 个 值 
机， 不 论 否 包含 下 本 组 。 后 续 的 值 息 匹 配 组 括号 所 捕获 的 字符 申 。 这些 
号 的 顺序 出 现 ， 除 非 有 和 肯 套 的 情况 。 请 看 下 面 的 例子 : 


;; 利用 正则 表达 式 来 捕获 和 分 解 电话 号 码 及 其 标题 。 
(def re-phone-number #"(\w+): \((\d{3})\) (\d{3}-\d{4})") 




















总 是 完整 的 匹 


获 的 值 将 按 括 





(re-seq re-phone-number "Home: (919) 555-1234, Work: (191) 555-1234") 
;; -> (["Home: (919) 555-1234" "Home" "919" "555-1234"] 
;; ["Work: (191) 555-1234" "Work" "191" "555-1234"]) 




















如 果 只 要 在 字符 串 中 寻找 一 次 匹配 ， 那 就 使 用 re-find。 它 的 行为 几乎 和 re-seq 一 样 , 但 
只 返回 第 一 次 匹配 的 一 个 值 ， 而 不 是 一 系列 的 匹配 值 。 





























除了 re-seq 以 外 ， 还 有 另 一 种 方法 可 以 迭代 访问 字符 串 中 的 所 有 匹配 。 可 以 在 re-matcher 
上 反复 调用 re-find， 但 我 们 不 建议 这 样 做 ， 因 为 它 不 太 符 合 Clojure 的 习惯 。 改 变 一 个 
re-matcher 对 象 ， 然 后 反复 调用 re-find 就 是 不 对 ， 它 完全 违反 了 纯 函 数 式 的 原则 。 我 们 
强烈 建议 使 用 re-seq， 而 不 是 re-matcher 和 re-find， 除 非 真有 好 的 理由 。 



































参阅 

。 1.7 节 “ 按 模式 查找 字符 串 "， 查 找 了 字符 串 中 出 现 的 模式 。 

。 1.9 节 “ 对 字符 串 执行 查找 和 替换 ”， 利 用 了 正则 表达 式 来 查找 和 替换 字符 串 的 某 些 部 分 。 

。 java.lang.Pattern 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/util/regex/Pattern. 
html) ， 其 中 定义 了 Java 支持 的 正则 表达 式 语法 (Clojure 的 正则 表达 式 一 样 )。 


1.9 对 字符 串 执行 查找 和 和 蔡 换 


作者 : Ryan Neufeld 




















问题 
需要 修改 字符 串 的 某 些 部 分 ， 使 它们 匹配 某 种 确定 的 模式 。 


解决 方案 

如 果 要 选择 性 地 赫 换 字符 串 中 的 某 些 部 分 ， 多 才 多 艺 的 clojure.string/replace 就 是 我 们 
要 找 的 函数 。 

对 于 简单 的 模式 ， 用 replace 时 带 一 个 普通 的 字符 串 ， 作 为 它 的 匹配 模式 : 


(def about-me "My favorite color is green!") 
(clojure.string/replace about-me "green" "red") 
;; -> "My favorite color is red!" 











(defn de-canadianize [s] 
(clojure.string/replace s "ou" "0")) 
(de-canadianize (str "Those Canadian neighbours have coloured behaviour" 
" when it comes to word endings")) 
;; -> "Those Canadian neighbors have colored behavior when it comes to word 
endings" 
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简单 的 字符 串 替 换 只 能 完成 这 样 的 功能 。 如 果 需 要 替代 的 模式 中 包含 某 些 可 变性 ， 就 需要 
寻找 更 强大 的 武器 : 正则 表达 式 。 使 用 Clojure 的 正则 表达 式 文法 (#"...") 来 指定 正则 表 
达 式 模式 : 





(defn linkify-comment 
"Add Markdown-style Links for any GitHub issue numbers present in comment" 
[repo comment] 
(clojure.string/replace comment 
#"#(\d+)" 
(str "[#$1](https://github.com/" repo "/issues/$1)"))) 


(linkify-comment "next/big-thing" "As soon as we fix #42 and #1337 we 
should be set to release!") 
;; -> "As soon as we fix 


[#42](https://github.com/next/big-thing/issues/42) and 
2 [#1337](https://github.com/next/big-thing/issues/1337) we 
3 should be set to release!" 

外 * 八 

讨论 


replace 是 字符 串 函 数 中 最 强大 、 最 复杂 的 之 一 。 这 种 复杂 性 主要 来 自 于 它 可 以 进行 不 同 
的 匹配 和 替换 。 





如 果 传人 一 个 字符 串 来 匹配 ，reptace 期 待 一 个 字符 串 来 奉 换 。 在 被 查 字符 串 中 ， 所 有 发 
生 的 匹配 都 会 被 直接 替换 成 替代 字符 串 。 


如 果 传 入 一 个 字符 〈 如 \c 或 \n) 来 匹配 ，replace 期 待 一 个 字符 来 替换 。 就 像 字符 串 替 换 
字符 串 一 样 ，reptLace 的 字符 替换 字符 的 模式 也 是 直接 替换 的 。 


如 果 传 入 一 个 正则 表达 式 来 匹配 ，replace 就 有 趣 得 多 了 。 正 则 表达 式 匹 配 的 一 种 可 能 替 
换 是 一 个 字符 串 ， 就 像 在 Linkify-comment 的 例子 中 那样 。 这 个 字符 串 将 特殊 的 字符 组 合 
(如 $1 和 $2) 解释 为 变量 ， 并 替换 成 匹配 结果 中 的 匹配 组 。 在 Linkify-comment 的 例子 中 ， 
所 有 数字 符号 (#) 后 跟着 连续 的 数字 (\d+) 被 括号 捕获 ， 在 替代 时 作为 $1 提供 。 










































































如 果 传 和 人 一 个 正则 表达 式 来 匹配 ， 也 可 以 提供 一 个 国 数 作为 替换 ， 而 不 是 一 个 字符 串 。 
在 Clojure 中 ， 如 果 能 传人 一 个 国 数 作为 参数 ， 整 个 世界 都 由 你 作 主 了 。 可 以 在 可 复 用 
(并 且 可 测试 ) 的 函数 中 捕获 替换 ， 根 据 情 况 传 人 不 同 的 函数 ， 甚 至 传 和 一 个 映射 表 来 控 
制 替 换 : 

;; Linkify-comment 重 写 ， 替换 时 使 用 独立 的 函数 


(defn linkify [repo [full-match id]] 
(str "[" full-match "](https://github.com/" repo "/issuyes/" id ")")) 
































(defn linkify-comment [repo comment] 
(clojure.string/replace comment #"#(\d+)" (partial linkify repo))) 





如 果 你 以 前 没 用 过 正则 表达 式 ， 用 一 下 就 会 立刻 喜欢 上 它 。 在 修改 字符 串 时 ， 正 则 表达 式 
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是 强大 的 工具 ， 非 常 灵活 。 就 像 所 有 强大 的 新 工具 那样 ， 很 容易 被 滥用 。 因 为 它们 简明 而 
紧凑 的 语法 ， 很 容易 导致 正则 表达 式 既 难以 解读 ， 又 很 容易 犯错 。 应 该 谨慎 使 用 正则 表达 
式 ， 并 且 只 在 完全 理解 其 语法 时 才 使 用 。 









































要 学 习 和 掌握 正则 表达 式 的 语法 ，Jeffrey Friedl 的 Mastering Regular Expressions, 3rd ed. 
(O’Reilly) 是 一 本 很 好 的 书 。 





参阅 

。 1.7 节 “ 按 模式 查找 字符 串 ”。 

。 cLojure.string/repLace-first， 该 国 数 与 clojure.string/replace 几乎 一 样 ， 但 只 
换 第 一 次 匹配 。 

。 java.lang.Pattern 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/util/regex/ 
Pattem html)， 其 中 定义 了 Java 支持 的 正则 表达 式 语法 Clojure 的 正则 表达 式 一 样 )。 


1.10 ”将 字符 串 切 分 成 部 分 


作者 : Ryan Neufeld 





St 





问题 

需要 将 字符 串 切 分 成 若干 部 分 。 

解决 方案 

使 用 cLojure.string/spLit， 将 字符 串 切 分 成 一 组 子 串 。splLit 接受 两 个 参数 ， 一 个 是 待 切 
分 的 字符 串 ， 男 一 个 是 切 分 依据 的 正则 表达 式 : 








(clojure.string/split "HEADER1,HEADER2,HEADER3" #",") 
;; -> ["HEADER1" "HEADER2" "HEADER3"] 


(clojure.string/split "Spaces Newlines\n\n" #"\s+") 
;; -> ["Spaces" "Newlines"] 


讨论 

除了 简单 地 按 正则 表达 式 切 分 之 外 ，sptit 允许 你 控制 切 分 的 次 数 。 你 可 以 利用 可 选 的 
Linit 参数 做 到 这 一 点 。limit 最 明显 的 效果 就 是 限制 结果 集合 里 值 的 个 数 。 也 就 是 说 ， 
limit 并 非 总 像 你 期 望 的 那样 工作 ， 而 且 即 使 不 提供 这 个 参数 ， 也 是 有 意义 的 。 


没有 limit 时 ，spLit 函数 将 返回 所 有 可 能 的 切 分 ， 但 排除 尾部 的 空 匹 配 : 
;; 按 空白 字符 切 分 ， 没有 指明 Limit， 执 行 了 隐 式 的 去 除 空白 字符 操作 
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(clojure.string/split "field1 field2 field3 " #"\s+") 
;; -> ["field1" "field2" "field3"] 


如 果 你 想 要 的 就 是 所 有 匹配 ， 包 括 尾 部 的 空 匹配 ， 那 么 可 以 将 Limit 指定 为 -1。 
;; 在 CSV 解析 时 ， 行 末 的 空 匹配 仍然 是 有 意义 的 


(clojure.string/split "ryan,neufeLd,"#"， -1) 
;; -> ["ryan" "neufeld" | 

















地 





将 Limit 指定 为 其 他 正 数 ， 导 致 split 最 多 返回 Limit 个 子 
(def data-delimiters #"[ :-]") 
;; 没有 Limit， 按 所 有 定 界 符 切 分 


(clojure.string/split "2013-04-05 14:39" data-delimiters) 
;; -> ["2013" "04" "05" "14" "39"] 








;; Limit 为 1， 返 回 包含 这 个 字符 串 的 集合 
(clojure.string/split "2013-04-05 14:39" data-delimiters 1) 
;; -> ["2013-04-05 14:39"] 











;; Limit 为 2 
(clojure.string/split "2013-04-05 14:39" data-delimiters 2) 
;; -> ["2013" "04-05 14:39"] 


;; Limit 为 100 
(clojure.string/split "2013-04-05 14:39" data-delimiters 100) 
;; -> ["2013" "04" "05" "14" "39"] 


参阅 
。 clojure.string 命名 空间 API 文档 (http://clojure.github.io/clojure/clojure.string-api.html) 。 


1.7 市 “ 按 模 式 查 找 字 符 串 ”。 
。 1.8 市 “利用 正则 表达 式 从 字符 串 中 取出 值 ”。 


1.11 于 数量 为 字符 串 加 复数 


作者 : Ryan Neufeld 





@ 
了 





问题 
需要 基于 数量 为 单词 添加 复数 ， 如 “0 eggs” 或 “1 chicken 。 


a 
解决 方案 

如 果 需 要 得 到 Ruby on Rails 风格 的 复数 ， 请 使 用 Roman Scherer 的 inflections 库 (https:// 
github.com/rOman/inflections-clj ) 。 





要 继续 这 个 实例 ， 先 用 lein-try 开始 REPL 


$ lein try inflections 

















使 用 inflections.core/pluralize 时 带 一 个 计数 参数 ， 如 果 计 数 不 为 1， 尝 试 给 出 单词 的 
et 
复数 : 





(require '[inflections.core :as inf]) 


(inf/pluralize 1 "monkey") 
;; -> "1 monkey" 


(inf/pluralize 12 "monkey") 
;; -> "12 monkeys" 


如 果 有 特殊 或 非 标 准 的 复数 形式 ， 可 以 为 pluralize 提供 第 3 个 可 选 参数 ， 指 定 自己 的 复 
数 形式 : 





(inf/pluralize 1 "box" "boxen") 
;; -> "1 box" 


(inf/pluralize 3 "box" "boxen") 
;; -> "3 boxen" 


讨论 

对 于 展现 给 用 户 的 文字 ， 变 形 是 关键 。 让 程序 或 网 站 的 输出 人 性 化 ， 有 益 于 建立 值得 信任 
的 专业 形象 。 对 于 用 户 友好 的 、 人 性 化 的 文字 ，Ruby on Rails (http://rubyonrails.org/) 用 
它 的 Active Support::Inflections 类 ， 建 立 了 一 个 黄金 标准 。InftLections#pLuraLize 就 
是 这 样 一 种 变形 ， 但 Inflections 充满 了 听 起 来 讨 人 喜爱 的 方法 ， 以 “ize” 结 尾 ， 改 变 字 
符 串 的 形态 。 在 Clojure 环境 中 ，Inflections 几乎 提供 了 所 有 这 些 功 能 。 


Inflections 库 中 有 两 个 有 趣 的 函数 ，plural 和 singular。 这 两 个 函数 有 点 像 单词 复数 的 
upper-case 和 lower-case。plural 将 单词 转变 成 复数 形式 ，singular 将 单词 转换 成 单数 
形式 。 这 些 转换 基于 inflections.plural 中 的 一 些 规则 。 你 可 以 利用 inflections.core/ 
plural， 添 加 自己 的 复数 规则 1 





(inf/plural "box") 
;; -> "boxes" 


;; 以 'ox' 结尾 的 单词 复数 加 'en' (而 不 是 'es') 
(inf/plural! #"(ox)(?i)$" "$1en") 





(inf/plural "box") 
;; -> "boxen" 





注 3: 如 果 还 没有 安装 lein-try， 请 按照 前 言 中 “我 们 的 金 童 lein-try” 的 指令 安装 。 
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;; plural 也 是 pluralize 的 基础 … 
(inf/pluralize 2 "box") 
;; -> "2 boxen" 





该 库 也 支持 camelize、parameterize 和 ordinalize 等 变形 : 


;; 将 "snake_case" 变 为 "CamelCase" 
(inf/camelize "my_object") 
;; -> "MyObject" 


;; 清理 字符 串 ， 用 于 URL 参数 
(inf/parameterize "My most favorite URL!") 
;; -> "my-most-favorite-url" 








;; 将 基数 变 为 序数 
(inf /ordinalize 42) 
;; -> "42nd" 


sh 


阅 
。 inflections-clj GitHub 库 (https://github.com/r0man/inflections-clj/) ， 了 解 最 新 支持 的 变 
形 请 单 。 


1.12 在 字符 串 、 符 号 和 关键 字 之 间 转 换 


作者 : Colin Jones 





问题 
有 一 个 字符 串 、 符 号 或 关键 字 ， 需 要 转换 成 不 同 的 、 像 字符 串 一 样 的 数据 类 型 。 


解决 方案 
要 将 字符 串 转换 成 符号 ， 请 使 用 symbot 函数 ， 


(symbol "valid?") 
;; -> valid? 


要 将 符号 转换 成 字符 串 ， 请 使 用 str: 


(str 'valid?) 
;; -> "valid?" 








如 果 有 一 个 关键 字 要 转换 成 字符 串 ， 可 以 使 用 name， 如 果 需 要 头 上 的 冒号 ， 可 以 使 用 str: 





(name :triumph) 





;; -> "triumph" 

;; 或 者 ， 包 含 头 上 的 冒号 
(str :triumph) 

;; -> ":triumph" 


要 将 符号 或 字符 串 转 换 成 关键 字 ， 请 使 用 keyword: 


(keyword "fantastic") 
;; -> :fantastic 


(keyword 'fantastic) 
;; -> :fantastic 


要 将 关键 字 转 换 成 符号 ， 需 要 一 个 中 间 步 骤 ， 即 通过 name: 


(symbol (name :wonderful)) 
;; -> wonderful 


讨论 

这 里 主要 的 转换 函数 是 str、keyword 和 symboL， 每 个 名 称 对 应 它 返回 的 数据 类 型 。 其 中 
symbol 有 一 点 严格 ， 它 允许 的 参数 只 能 是 字符 串 ， 这 就 是 为 什么 关键 字 转 换 成 符号 需要 一 
个 中 间 步 又 。 








这 些 类 型 之 间 还 有 另 一 个 不 同 之 处 : 即 关键 字 和 符号 可 能 带 有 命名 空间 ， 中 间 用 和 斜 杠 (/) 
分 开 。 对 于 这 种 类 型 的 关键 字 和 符号 ，name 函数 可 能 够 用 ， 也 可 能 不 够 用 ， 这 取决 于 使 用 
的 情况 : 








;; 如 果 只 想 要 关键 字 的 名 字 部 分 
(name :user/valid?) 
;; -> "valid?" 











3 3 如 果 只 想 要 命名 空 间 
(namespace :user/valid?) 
;; -> "User" 





通常 ， 实 际 上 想 要 的 是 两 个 部 分 。 可 以 分 别 取 得 这 两 个 部 分 ， 然 后 将 它们 连接 起 来 ， 中 间 
加 上 /,， 但 还 有 更 容易 的 方式 。Java 有 大 量 高 效率 的 方法 ， 来 处 理 不 可 修改 的 字符 串 。 可 
以 利用 java.lang.String.substring(int)， 消 除 冒 号 开头 的 字符 串 的 第 一 个 字符 : 




















(str :user/valid?) 
;; -> ":Uuser/valid?" 


(.substring (str :user/valid?) 1) 
;; -> "User/valid?" 





关于 字符 串 的 更 多 方法 ， 参 见 java.Lang.String 的 API 文档 (http://docs.oracle.com/javase/ 
7/docs/apiyjava/lang/String.html) 。 
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你 可 以 容易 地 将 带 命 名 空间 的 符号 转换 成 关键 字 ， 就 像 不 带 命名 空间 的 符号 一 样 ， 但 再 次 
强调 ， 反 方向 转换 (关键 字 转 换 成 符号 ) 需要 增加 一 个 步骤 : 





(keyword 'produce/onions) 
;; -> :produce/onions 


(symbol (.substring (str :produce/onions) 1)) 
;; -> produce/onions 


最 后 ，keyword 和 symbot 函数 都 有 两 个 参数 的 版 本 ， 人 允许 你 分 别传 入 命名 空间 和 名 字 。 有 
时 候 这 样 更 好 ， 例 如 ， 如 果 两 个 值 中 有 一 个 或 两 个 已 经 定义 在 def 、let 或 其 他 范围 中 : 









































(def shopping-area "bakery") 


(keyword shopping-area "bagels") 
;; -> :bakery/bagels 


(symbol shopping-area "cakes") 

;; -> bakery/cakes 
这 三 个 类 似 字符 串 的 数据 类 型 在 不 同情 况 下 分 别 适 用 ， 如 何 选 择 又 是 另外 一 个 话题 。 但 常 
常 需要 在 它们 之 间 进 行 转换 ， 所 以 ， 将 keyword、symbol、str、namespace 和 name 放 入 你 
的 工具 栏 中 会 很 方便 。 











参阅 
。 1.5 节 “ 字 符 与 整数 的 转换 ”。 


1.13 利用 非常 大 或 非常 小 的 数 来 保持 精度 


作者 : Ryan Neufeld 


问题 
需要 精确 地 处 理 数 字 ， 尤 其 是 那些 非常 大 或 非常 小 的 数字 ， 消 除 double 这 样 的 浮 点 表示 法 
所 隐 仿 的 不 精确 。 


解决 方案 
首先 ， 要 知道 Clojure 支持 以 指数 形式 表示 数字 ， 人 允许 简洁 地 表示 非常 大 或 非常 小 的 数字 : 
;; 阿 伏 伽 德 罗 常数 


6.0221413e23 
;; -> 6.0221413E23 




















;; 1 埃 相当 于 多 少 米 
1e-10 
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;; -> 1.0E-10 


如 果 整 数值 超过 了 有 边界 类 型 (如 Long) 的 上 界 ， 就 会 导致 整数 溢出 错误 。 使 用 “引号 ” 
版 本 的 数字 操作 ， 如 - 或 *， 可 以 提升 到 Big 类型: 


(* 9999 9999 9999 9999 9999) 
;; ArithmeticException integer overfLow clojure.lang.Numbers.throwIntOverflow 


(*' 9999 9999 9999 9999 9999) 
;; -> 99950009999000049999N 


讨论 

Clojure 有 一 些 数值 类 型 int 和 long、double、BigInteger 以 及 BigDecimal。 有 边界 的 类 
型 (int、Long 和 double) 都 会 在 这 些 类 型 的 总 边界 内 无 颖 转换。 超出 这 个 边界 会 导致 两 
种 情况 发 生 : 对 于 整数 ， 会 产生 整数 溢出 错误 ; 对 于 浮 点 数 ， 结 果 将 变 成 无 穷 大 。 在 使 用 
整数 时 ， 可 以 用 引号 版 本 的 +、-、* 和 /来 避免 这 个 错误 。 这 些 操作 支持 任意 的 精度 ， 在 
需要 时 会 将 整数 提升 为 BigInteger。 


浮 点 值 更 难处 理 一 些 。 引 号 版 本 的 数值 操作 没有 帮助 。 你 需要 使 用 BigDecimal 类 型 ， 来 
“传染 ”操作 。 在 Clojure 中 ，BigInteger 和 BigDecimal 就 是 所 谓 的 “传染 ”类 型 。 只 要 在 
操作 中 引入 一 个 “大 ” 数 ， 它 就 会 传染 所 有 接 下 来 的 结果 。 你 可 以 通过 某 种 操作 ， 例 如 用 
BigDecimal 的 1 去 乘 一 个 数 ， 但 更 简单 的 方法 是 使 用 btgdec 或 bigint， 手 工 提升 一 个 值 : 






































(* 2 Double/MAX_VALUE) 
;; -> Double/POSITIVE_INFINITY 


(* 2 (bigdec Double/MAX_VALUE)) 
;; -> 3.5953862697246314E+308M 





传染 不 只 是 发 生 在 这 些 Big 类 型 中 ， 它 也 发 生 在 整数 到 浮 点 数 的 边界 上 。 对 于 整数 来 说 ， 
序 点 数 是 传染 的 。 包 含 任何 浮 点 值 的 运算 都 会 得 到 浮 点 值 。 








参阅 
。 1.14 节 “ 使 用 有 理 数 ”， 探 讨 了 在 使 用 有 理 数 时 保持 精度 。 


1.14 使 用 有 理 数 


作者 : Ryan Neufeld 


问题 
需要 以 绝对 的 精度 操作 有 理 数 。 
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解决 方案 














在 操作 整数 (或 其 他 有 理 数 ) 时 ， 你 可 能 希望 保持 精度 ， 包 括 循环 有 理 数 ， 如 1/3 (0.333 


i) 


(/ 1 3) 
;; -> 1/3 


(type (/ 1 3)) 
;; -> clojure.lang.Ratio 


(* 3 (/ 1 3)) 
;; -> 1N 


在 double 类 型 上 使 用 rationalize， 将 它们 


(+ (/ 1 3) 0.3) 
;; -> 0.6333333333333333 


(rationalize 0.3) 
;; -> 3/10 


(+ (/ 1 3) (rationalize 0.3)) 
;; -> 19/30 


讨论 














强制 转换 成 有 理 数 ， 以 避免 损失 精度 : 














在 处 理 数 值 时 ，Clojure 尽 可 能 保持 精度 ， 尤 其 是 对 整数 。 在 整数 除法 中 ，Clojure 将 商 表 
示 为 精确 的 整数 比 ， 而 不 是 有 损耗 的 double 类 型 ， 从 而 保持 准确 性 。 但 这 种 准确 性 是 有 
代价 的 ， 和 其 他 简单 类 型 的 操作 相 比 ， 有 理 数 的 操作 要 慢 得 多 。 正 如 1.13 节 “ 利 用 非常 












































大 或 非常 小 的 数 来 保持 精度 ”中 讨论 的 那 术 
来 衡量 。 


E， 精 度 总 是 性 能 的 妥协 ， 需 要 根据 面 对 的 问题 


在 同时 操作 double 和 有 理 数 时 ， 要 小 心 。 由 于 Clojure 的 类 型 传染 方式 ， 对 两 个 类 型 执行 
操作 会 导致 有 理 数 被 强制 转换 成 doubte 类 型 。 这 种 转换 对 单个 操作 不 一 定 是 不 准确 的 ， 但 








类 型 的 改变 可 能 导致 不 准确 性 悄悄 发 生 。 
在 处 理 double 时 ， 要 保持 准确 性 ， 请 使 用 





rationalize 国 数 。 这 个 函数 返回 任何 数 的 有 理 





数值 。 对 可 能 是 double 类 型 的 值 调用 rationaLize， 能 保持 绝对 精确 〈 但 要 以 牺牲 性 能 忒 


代价 )。 


参阅 


。 1.13 市 “利用 非常 大 或 非常 小 的 数 来 保持 精度 ”。 





1.15 解析 数字 


作者 : Ryan Neufeld 


问题 

需要 从 字符 串 中 解析 4H 
解决 方案 

对 于 “正常 ”大 小 的 整数 或 双 精 度数 ， 请 使 用 Integer/parseInt 或 Double/parseDouble 来 
解析 : 





注 





(Integer/parseInt "-42") 
;; -> -42 


(Double/parseDouble "3.14") 
;; -> 3.14 


讨论 

什么 是 “正常 ”大 小 的 数 ? 对 于 Integer/parseInt 来 说 ， 正 常 就 是 小 于 Integer/MAX_VALUE 
(2147483647) 。 对 于 Double/parseDouble 来 说 ， 正 常 就 是 小 于 Double/MAX_VALUE ( 约 1.79 
x 10^308) 。 


如 有 果 要 解析 的 数 要 么 大 大， 要么 精度 太 高 ， 就 需要 使 用 BigInteger 或 BigDecimal， 以 避免 
精度 损失 。 


多 才 多 艺 的 bigint 和 bigdec 函数 可 以 将 字符 串 (或 任何 其 他 数字 类 型 ) 强制 转换 成 无 限 
精度 的 容器 : 














(bigdec "3.141592653589793238462643383279502884197") 
;; -> 3.141592653589793238462643383279502884197M 


(bigint "122333444455555666666777777788888888999999999") 
;; -> 122333444455555666666777777788888888999999999N 


阅 


Integer/parseInt (http://docs.oracle.com/javase/7/docs/api/java/lang/Integer.html#parseInt(java. 


. Ns 


lang.String)) 和 Double/parseDouble (http://docs.oracle.com/javase/7/docs/api/java/lang/Double. 
html#parseDouble(java.lang.String)) 的 API 文档 。 
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1.16 数 的 截断 和 舍 入 
作者 : Ryan Neufeld 

问题 

需要 截断 或 伟人 小 数 ， 成 为 低 精度 的 数 。 
解决 方案 


如 果 只 关心 整数 部 分 ， 请 使 用 int， 将 该 数 强 制 转换 成 整数 。 当 然 ， 这 会 完全 丢弃 小 数 部 
分 ， 没 有 任何 的 进位 : 


























(int 2.0001) 
;; ->2 


(int 2.999999999) 
pe 


如 果 仍 然 期 望 某 种 程度 的 精度 ， 可 能 希望 舍 入 。 可 以 使 用 Math/round， 进 行 简单 的 舍 入 : 





(Math/round 2.0001) 
;; ->2 


(Math/round 2.999) 
;; ->3 


;; 这 等 价 于 : 
(int (+ 2.99 0.5)) 
-> 3 





如 果 和 希望 进行 不 平衡 的 舍 入 ， 诸 如 无 条 件 地 “ 舍 入 到 较 大 数 ” 或 “ 舍 入 到 较 小 数 ”"， 那 就 
应 该 分 别 使 用 Math/ceil 或 Math/floor: 


(Math/ceil 2.0001) 
;; -> 3.0 


(Math/floor 2.999) 
;; -> 2.0 


你 会 注意 到 这 些 函 数 返 回 小 数 。 要 得 到 整数 ， 请 在 ceil 或 floor 外 面 调用 int。 





讨论 
“伟人 ”数字 最 简单 的 方法 就 是 截断 。int 会 完成 这 项 任务 ， 将 浮 点 数 强 制 转换 成 整数 ， 简 
单 地 将 小 数 部 分 丢弃 。 这 在 数学 上 不 一 定 对 ， 但 如 果 面 对 的 问题 允许 ， 这 样 肯定 很 方便 。 




















Math/round 是 更 高 一 级 的 舍 人 技术 。 就 像 Clojure 中 的 许多 其 他 原生 操作 函数 一 样 ， 这 门 
语言 倾向 于 “不 重新 发 明 轮 子 ”。Math/ round 是 一 个 Java 函数 ， 舍 入 的 方法 是 先 加 上 1/2， 
再 像 int 那样 丢弃 小 数 部 分 。 


对 于 更 高 级 的 舍 人 ， 诸 如 控制 小 数位 或 复杂 的 进位 模式 ， 可 能 需要 使 用 with-precision 国 
数 。 你 也 许 已 经 知道 BigDecimal 类 型 背后 是 Java 类 ， 但 也 许 不 知道 Java 提供 了 一 些 控制 
方法 来 调整 Bigpecimat 的 计算 。with-precision 提供 了 这 些 方法 。 





with-precision 是 一 个 宏 ， 它 接受 一 个 BigDecimal 的 精度 模式 和 任意 数目 的 表达 式 ， 在 
BigDecimal 的 上 下 文中 执行 这 些 表 达 式 ， 调 整 到 那 种 精度 。 那 么 精度 看 起 来 是 怎样 的 ? 
好 吧 ， 它 有 点 奇怪 。 最 基本 的 精度 就 是 一 个 正 整数 “范围 ” 值 。 这 个 值 指 定 了 小 数 点 后 
保留 几 位 。 更 复杂 的 精度 涉及 一 个 :rounding 值 ， 以 键 / 值 对 的 形式 指定 ， 如 :rounding 
FLOOR (这 当然 是 一 个 宏 ， 为 什么 不 呢 ?)。 如 果 未 指定 ， 舍 入 模式 就 是 HALF_UP， 但 可 以 
是 CEILING、FLOOR、HALF_UP、HALF_DOWN、HALF_EVEN、UP、DOWN、UNNECESSARY 中 的 任何 
一 个 


lo 











(with-precision 3 (/ 7M 9)) 
;; -> 0.778M 


(with-precision 1 (/ 7M 9)) 
;; -> 0.8M 


(with-precision 1 :rounding FLOOR (/ 7M 9)) 
;; -> 0.7M 


关于 with-precision， 有 一 个 “ 坑 ” 值 得 一 提 : 它 只 改变 BigDecimal 运算 的 行为 ， 其 他 常 
规 的 运算 不 变 。 必 须 用 字面 值 (3M) 在 表达 式 中 引入 BigDecimal 的 值 ， 或 者 使 用 bigdec 
函数 : 


























(with-precision 3 (/ 1 3)) 
;; -> 1/3 


(with-precision 3 (/ (bigdec 1) 3)) 





;; -> 0.333M 
参阅 
。 1.13 三“ 利用 非常 大 或 非常 小 的 数 来 保持 精度 ”， 探 讨 了 BigDecimal 的 更 多 内 容 ， 尤 其 


是 类 型 传染 。 
。 1.17 节 “ 模 糊 比较 "。 
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1.17 模糊 比较 


作者 : Ryan Neufeld 











问题 
需要 检测 是 否 相 等 ， 并 容忍 一 些小 误差 。 这 在 比较 浮 点 数 时 尤其 是 个 问题 ， 因 为 浮 点 数 容 











易 在 反复 操作 之 后 发 生 “ -漂移 "。 


解决 方案 
Clojure 没有 内 建 的 函数 实现 容错 相等 比较 ， 或 者 说 “模糊 比较 ”， 大 家 常 这 么 说 。 因 为 很 
容易 实现 你 自己 的 fuzzy= 函数 : 








(defn fuzzy= [tolerance x y] 
(Let [diff (Math/abs (- x y))] 
(< diff tolerance))) 


(fuzzy= 0.01 10 10.000000000001) 
; -> true 


(fuzzy= 0.01 10 10.1) 
; -> false 


讨论 
fuzzy= 的 工作 方式 就 像 大 多 数 模糊 比较 算法 一 样 : 首先 找到 两 个 操作 数 的 绝对 差 值 ， 其 次 
测试 差 值 是 否 小 于 给 定 的 容忍 值 。 当 然 ， 没 有 什么 规定 容忍 值 必 须 是 某 个 很 小 的 小 数 。 如 
果 要 比较 很 大 的 数 ， 和 希望 忽略 1000 以 下 的 差异 ， 也 可 以 把 容忍 值 设 为 1000。 


即使 使 用 fuzzy=， 在 比较 浮 点 值 时 也 需要 小 心 ， 尤 其 是 那些 差 值 很 接近 容忍 值 的 数 。 当 差 
值 接近 提供 的 容忍 值 时 ， 你 可 能 发 现 结果 有 点 奇怪 : 




































































(- 0.22 0.23) 
; -> -0.010000000000000009 


(- 0.23 0.24) 
; -> -0.009999999999999981 





虽然 这 很 奇怪 ,但 也 在 预料 之 中 。IEEE 754 规范 是 关于 浮 点 数 的 ， 它 有 意 限制 了 7 格式， 这 
是 精度 和 性 能 的 折 中 。 如 果 想 要 绝对 的 精确 ， 就 应 该 使 用 BigDecimal 或 BigInt。 参 见 1.13 
节 “ 利 用 非常 大 或 非常 小 的 数 来 保持 精度 "， 该 节 探 讨 了 这 两 个 类 型 的 更 多 内 容 。 


fuzzy= 国 数 的 这 种 写法 ， 有 一 些 有 趣 的 副作用 。 首 先 ， 使 用 容忍 值 作 为 第 一 个 参数 ， 让 它 
能 够 利用 partial 实现 部 分 应 用 的 相等 判断 函数 ， 指 定 某 个 容忍 值 : 








(def equal-within-ten? (partial fuzzy= 10)) 


(equal-within-ten? 100 109) 
;; -> true 


(equal-within-ten? 100 110) 
;; -> false 


如 果 想 在 排序 中 使 用 模糊 比较 怎么 办 ? sort 函数 接受 一 个 可 选 的 参数 作为 判断 或 比较 方 
法 。 让 我 们 来 写 一 个 fuzzy-comparator 函数 ， 它 按 给 定 的 容忍 值 返 回 一 个 比较 方法 : 





(defn fuzzy-comparator [toLerance] 
(fn [x y] 
(if (fuzzy= tolerance x y) ; © 
0 
(compare x y)))) ; © 


(sort (fuzzy-comparator 10) [100 11 150 10 9]) 
;; -> (11 10 9 100 150) ; 100 和 150 移 动 了 位 置 ,但 11.10 和 9 没有 


@ 如 果 两 个 比较 的 值 在 tolerance 范围 之 内 ， 返 回 6 表示 它们 相等 。 
名 否则 退回 到 正常 的 compare。 





参阅 

。 关于 IEEE 浮 点 数 的 维基 百科 (http://en.wikipedia.org/wiki/IEEE_floating_point)。 
。 1.13 节 “ 利 用 非常 大 或 非常 小 的 数 来 保持 精度 ”。 

。 1.16 节 “ 数 的 截断 和 舍 入 ”。 


1.18 三 角 计 算 


作者 : Ryan Neufeld 


需要 实现 一 些 数学 函数 ， 要 求 三 角 计算 。 


解决 方案 

所 有 的 三 角 国 数 都 可 以 通过 java.lang.Math (http://docs.oracle.com/javase/7/docs/api/ 
java/lang/Math.html) 来 访问 ， 它 以 Math 的 形式 提供 。 使 用 它们 就 像 其 他 带 命 名 空间 的 
函数 一 样 : 


;; 计算 sin(a + b). 公式 是 
;; Sin(a + b) = sin a* cos b+ sin b cos a 
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(defn sin-plus [a b] 
(+ (* (Math/sin a) (Math/cos b)) 
(* (Math/sin b) (Math/cos a)))) 


(sin-plus 0.1 0.3) 
;; -> 0.38941834230865047 


三 角 函 数 操作 的 值 是 以 弧度 表示 的 。 如 果 值 是 以 角度 表示 的 ， 如 经 度 或 纬度 ， 就 需要 先 将 
它 转 换 成 弧度 。 使 用 Math/toRadians 将 角度 转换 成 弧度 : 


;; 计算 地 球 上 两 点 间 的 公里 数 
(def earth-radius 6371.009) 





(defn degrees->radians [point] 
(mapv #(Math/toRadians %) point)) 


(defn distance-between 
"Calculate the distance in km between two points on Earth. Each 
point is a pair of degrees latitude and longitude, in that order." 
([p1 p2] (distance-between pl p2 earth-radius)) 
([p1 p2 radius] 
(let [[Lat1 Long1] (degrees->radians p1) 
[lat2 long2] (degrees->radians p2)] 
(* radius 
(Math/acos (+ (* (Math/sin lat1) (Math/sin lat2)) 
(* (Math/cos lat1) 
(Math/cos lat2) 
(Math/cos (- long1 long2))))))))) 


(distance-between [49.2000 -98.1000] [35.9939, -78.8989]) 
;; -> 2139.42827188432 


讨论 
有 些 人 可 能 吃惊 于 Clojure 没有 自己 的 内 部 数学 命名 空间 ， 但 是 为 什么 要 “重新 发 明 轮 子 ” 
呢 ? 尽管 Java 的 名 声 不 太 好 ， 但 它 也 可 以 有 效率 ， 尤 其 是 在 数学 方面 。Clojure 与 Java 互 
操作 的 形式 加 上 它 的 语法 糖 ， 使 得 利用 java. lang.Math 来 完成 数学 运算 变 得 非常 愉快 。 


java.lang.Math 不 只 有 三 角 运算 。 它 也 包含 一 些 有 用 的 函数 ， 进 行 指 数 、 对 数 和 开 根 号 运 
算 。java.Lang.Math 的 javadoc 中 (http://docs.oracle.com/javase/7/docs/api/java/lang/Math. 
html) 有 完整 的 清单 。 




















参阅 
。 8.5 节 “ 利 用 类 型 暗示 减轻 性 能 问题 ”， 探 讨 了 改进 性 能 的 小 窍门 。 








1.19 根据 不 同 的 进 制 输入 和 输出 整数 


作者 : Ryan Neufeld 


问题 
需要 以 不 同 的 进 制 (如 十 六 进 制 或 二 进 制 )， 在 Clojure REPL 或 代码 中 输入 一 些 数 。 


解决 方案 
要 指定 常数 的 进 制 ， 就 是 在 它 前 面 加 上 进 制 数 (如 2、16 等 ) 和 字母 r。 从 2 到 36 的 进 制 
都 是 有 效 的 (当然 ， 可 以 用 10 个 数字 和 26 个 字母 ) : 


2r101010 
;; -> 42 








3r1120 
;; -> 42 


16r2A 
;; -> 42 


36rABUNCH 
;; -> 624567473 





要 输出 整数 ， 请 用 Java 方法 Integer/toString: 


(Integer/toString 13 2) 
;; -> "1101" 


(Integer/toString 42 16) 
a 


(Integer/toString 35 36) 
讨论 
不 像 大 多 数 Clojure 国 数 的 次 序 ， 这 个 方法 先 接受 一 个 整数 参数 ， 然 后 再 是 可 选 的 进 制 。 
这 使 得 它 很 难 部 分 地 应 用 ， 除 非 包装 成 另 一 个 国 数 。 你 可 以 为 Integer/tostring 写 一 个 小 
包装 函数 ， 来 实现 这 一 点 : 

















(defn to-base [radix n] 
(Integer/toString n radix)) 


(def base-two (partial to-base 2)) 


(base-two 9001) 
;; -> "10001100101001" 
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参阅 


a”， 探 讨 了 关于 format 的 信息 (o 和 x 分 别 指定 用 八进制 和 十 六 进 





1.6 节 “ 格 式 化 字符 上 
制 打 印 整数 )。 
。 1.15 节 “ 解 析 数 字 ”。 


1.20 ”计算 数值 集合 的 统计 值 


作者 : Ryan Neufeld 和 Jean Niklas L orange 


问题 





需要 计算 数值 集合 的 简单 统计 值 ， 如 均值 、 中 位 数 、 众 数 和 标准 差 。 


解决 方案 

















要 计算 集合 的 平均 值 ， 就 用 总 和 除 以 集合 的 元 素 个 数 count: 











(defn mean [coll] 


(let [sum (apply + coll) 
count (count coll)] 
(if (pos? count) 
(/ sum count) 


0))) 


(mean [1 2 3 4]) 
;; -> 5/2 


(mean [1 1.6 7.4 10]) 


;; -> 5.0 


(mean []) 

;; ->0 
要 找 出 集合 的 中 位 数 ， 
的 情况 有 特殊 的 考虑 。 








就 是 对 它 的 值 排序 ， 并 取得 中 间 的 值 。 当 然 ， 对 集合 有 偶数 个 元 素 
在 这 种 情况 下 ， 中 位 数 是 两 个 中 间 值 的 平均 值 : 











TI 




















(defn median [coll] 
(Let [sorted (sort coll) 
cnt (count sorted) 
halfway (int (/ cnt 2))] 
(if (odd? cnt) 


(nth sorted 


halfway) ; © 


(let [bottom (dec halfway) 
bottom-val (nth sorted bottom) 
top-val (nth sorted halfway)] 
(mean [bottom-val top-val]))))) ; @ 





(median [5 2 4 1 3]) 


;; > 3 


(median [7 0 2 3]) 
;; -> 5/2 ; The average of 2 and 3. 





@ 在 coll 有 奇数 个 元 素 的 情况 下 ， 只 要 用 nth 取得 那个 元 素 。 

如 如 果 coll 有 偶数 个 元 素 ， 找 到 另 一 个 中 间 值 的 下 标 (bottom)， 然 后 取 top 和 bottom 的 
平均 值 。 

要 找 出 集合 的 众 数 (最 常 出 现 的 值 )， 就 要 用 frequencies 记录 元 素 的 出 现 次 数 。 然 后 处 理 

这 些 记录 ， 取 得 众 数 的 离散 列表 : 

















(defn mode [coll] 

(let [freqs (frequencies coll) 
occurrences (group-by second freqs) 
modes (last (sort occurrences)) 
modes (->> modes 

second 
(map first))] 
modes)) 


(mode [:alan :bob :alan :greg]) 
;; -> (:alan) 


(mode [:smith :carpenter :doe :smith :doe]) 
;; -> (:smith :doe) 


标准 差 

要 找 出 样本 的 标准 差 ， 就 要 完成 以 下 步骤 。 

(1) 对 集合 中 的 每 个 值 ， 减 去 平均 值 nean， 结 果 再 平方 。 
(2) 然后 ， 将 这 些 值 相 加 。 

(3) 将 结果 除 以 值 的 个 数 减 1。 

(4) 最 后 ， 对 前 面 的 结果 取 平 方 根 : 



































(defn standard-deviation [coll] 

(let [avg (mean coll) 

squares (for [x coll] 

(let [x-avg (- x avg)] 
(* x-avg x-avg))) 
total (count coll)] 

(-> (/ (apply + squares) 
(- total 1)) 
(Math/sqrt)))) 


(standard-deviation [4 5295745 4]) 
;; -> 2.0 
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(standard-deviation [45544226]) 
;; -> 1.4142135623730951 


讨论 


mean 和 median 在 Clojure 中 都 很 容易 实现 ， 但 mode 需要 一 点 工作 量 。mode 与 mean 或 
median 有 点 不 同 ， 它 通常 对 非 数 值 数据 有 意义 。 计 算 集 合 的 众 数 比较 复杂 一 点 ， 和 相关 的 





一 些 数值 函数 相 比 ， 它 基本 上 需要 大 量 的 处 理 。 























下 面 是 mode 工作 方式 的 分 解 。 
(defn mode [coll] 

(Let [freqs (frequencies coll) ;0O 
occurrences (group-by second freqs) ; @ 
modes (last (sort occurrences)) ;© 
modes (->> modes ;0@ 

second 


(map first))] 
modes)) 


@ frequencies 返回 一 个 映射 表 ， 记 录 了 coll 中 每 个 元 素 的 出 现 次 数 。 它 的 样子 





{:a 1 :b 2}。 











@@ group-by 带 上 second 将 freqs 映射 表 倒转 ， 键 变 成 值 ， 并 将 重复 的 分 到 一 个 组 里 。 这 





将 {:a 1 :b 二 变 成 了 {1 [[:a 1] [:b 1]]}。 











@@ 出 现 次 数列 表现 在 可 以 排序 了 。 排 好 序 的 列表 中 ， 最 后 一 对 就 是 众 数 ， 或 最 


的 值 。 





常 出 现 


@ 最 后 一 步 是 将 原始 的 众 数 对 处 理 成 离散 的 值 ， 利 用 second 将 [2 [[:alan 2]]] 变 成 
[[:alan 2]]， 然 后 用 (map first) 将 它 变 成 (:alan)。 


标准 差 用 来 测量 在 平均 的 情况 下 ， 一 组 数据 的 单个 值 偏离 平均 值 的 程度 。 标 准 差 越 高 ， 单 
个 值 就 离 得 越 远 (平均 来 说 )。standard-deviation 比 mean、median 和 mode 更 数学 化 。 请 


























一 步 一 步 地 跟着 这 个 函数 执行 。 


(defn standard-deviation [coll] 
(let [avg (mean coll) ;0 
squares (for [x coll] ;@ 
(let [x-avg (- x avg)] 
(* x-avg x-avg))) 
total (count coll)] 
(-> (/ (apply + squares) ;© 
(- total 1)) 
(Math/sqrt)))) 


@ 计算 集合 的 平均 值 。 
名 对 于 每 个 值 ， 计 算 该 值 与 平均 值 之 差 的 平方 。 
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罩 最 后 ， 将 这 些 平 方 加 起 来 ， 除 以 元 素 个 数 减 1， 再 开平 方 ， 得 到 样本 的 标准 差 。 





如 果 有 完整 的 集合 ， 就 可 以 计算 总 体 标准 差 ， 除 以 total 而 不 是 (- total 1)。 


关于 标准 差 及 其 用 途 ， 可 以 参见 维基 百科 关于 标准 差 的 文章 (http://en.wikipedia.org/ 


wiki/Standard_deviation ) 。 


1.21 位 操作 


作者 : Ryan Neufeld 


问题 
需要 对 数字 进行 位 操作 。 


解决 方案 

与 C 或 C++ 这 样 的 系统 语言 相 比 ， 位 操作 在 高 级 语言 (如 Clojure) 中 不 太 常 见 ， 但 在 那 
些 系统 语言 中 学 到 的 技术 仍然 有 用 。Clojure 在 它 的 核心 命名 空间 中 提供 了 一 些 位 操作 ， 前 
级 是 bit- 。 位 操作 在 一 种 情况 下 非常 有 用 ， 那 就 是 将 大 量 二 进 制 标识 压缩 到 一 个 值 中 : 


;; 将 Unix 文件 系统 标识 的 子 集 放 到 一 个 整数 中 

(def fs-flags [:owner-read :owner-write 
:group-read :group-write 
:global-read :global-write]) 


;; 将 标识 放 到 " 标识 -> 位 " 的 映射 表 中 
(def bitmap (zipmap fs-flags 

(map (partial bit-shift-left 1) (range)))) 
;; -> {:owner-read 1, :owner-write 2, :group-read 4, ...} 





(defn permissions-int [& flags] 
(reduce bit-or 0 (map bitmap flags))) 


(def owner-only (permissions-int :owner-read :owner-write)) 
(Integer/toBinaryString owner-only) 
;; > 1 


(def read-only (permissions-int :owner-read :group-read :global-read)) 
(Integer/toBinaryString read-only) 
;; -> "10101" 
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讨论 


(defn able-to? [permissions flag] 
(not= 0 (bit-and permissions (bitmap flag)))) 


(able-to? read-only :global-read) ;; -> true 
(able-to? read-only :global-write) ;; -> false 


Li 


Clojure 在 它 的 核心 库 中 提供 了 完整 的 位 操作 。 这 包括 了 逻辑 操作 and 和 or， 它 们 的 取 


反 ， 





以 及 移 位 等 。 在 使 用 位 操作 时 ， 常 常 需要 查看 整数 的 二 进 制 表 示 。Java 的 Integer/ 








toBinaryString 可 以 方便 地 打印 出 数字 的 二 进 制 表示 。 


很 有 趣 的 是 ， 核 心 库 中 也 包括 bit-set 和 bit-test。 这 两 个 操作 用 于 集合 或 测试 整数 中 的 





单个 位 。 不 像 bit-and 那样 需要 操作 两 组 多 个 位 ， 你 可 以 操作 感 兴趣 的 标识 的 下 标 。 这 极 


大 地 简化 了 前 面 的 例子 : 


sh 


1 


UD 





;; 将 Unix 文件 系统 标识 的 子 集 放 到 一 个 整数 

(def fs-flags [:owner-read :owner-write 
:group-read :group-write 
:global-read :global-write]) 


(def bitmap (zipmap fs-flags 
(map #(.indexOf fs-flags %) fs-fLags))) 


(def no-permissions 0) 
(def owner-read (bit-set no-permissions (:owner-read bitmap))) 


(Integer/toBinaryString owner-read) 
;1 


油 分配 全 局 许可 

(def anything (reduce #(bit-set %1 (bitmap %2)) no-permissions fs-flags)) 
(Integer/toBinaryString anything) 

LTE" 


8.6 节 “ 用 原生 Java 数组 进行 快速 数学 运算 ”。 


.22 ”生成 随机 类 


作者 : Ryan Neufeld 


问 


题 


需要 生成 随机 数 。 
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解决 方案 
Clojure 提供 了 一 些 伪 随机 数 生成 函数 。 
要 生成 0.6 到 1.9 (但 不 包含 ) 的 随机 学 点 数 ， 请 使 用 rand: 














(rand) 
;; -> 0.0249306187447903 


(rand) 
;; -> 0.9242089829055088 





要 生成 随机 整数 ， 请 使 用 rand-int: 
;; 模拟 6 面 的 般 子 
(defn roLL-d6 [] 
(inc (rand-int 6))) 


(roll-d6) 
这 


(roLL-d6) 
PH 


讨论 
除了 生成 60.9 到 1.9 的 数 之 外 ，rand 也 接受 一 个 可 选 参数 ， 指 定 一 个 不 包含 在 内 的 最 大 
值 。 例 如 (rand 5) 将 返回 一 个 浮 点 数 ， 范 围 从 0.0 (包含 ) 到 5.0 (不 包含 )。 














(Crand-int 5) 则 返回 一 个 随机 整数 ， 从 6 (包含 ) 到 5 (不 包含 )。 乍 一 看 ，rand-int 似乎 
很 适合 用 来 从 向 量 或 列表 中 选择 一 个 随机 元 素 。 但 这 太 麻 烦 了 。 请 使 用 rand-nth， 从 任意 
的 序列 集合 (也 就 是 能 响应 nth 的 集合 ) 中 取得 一 个 随机 元 素 : 











(rand-nth [1 2 3]) 
;; ->1 


(rand-nth '(:a :b :c)) 

33 -> :CC 
但 这 对 set 或 hash map 不 起 作用 。 如 果 和 希望 从 set 这 样 的 非 序列 集合 中 取得 一 个 随机 元 素 ， 
请 先 使 用 seq 将 该 集合 变 成 一 个 序列 ， 再 调用 rand-nth: 














(rand-nth (seq #{:heads :tails})) 
;; -> :heads 


如 果 希 望 随机 排列 一 个 集合 ， 请 使 用 shuffle， 得 到 集合 的 随机 排列 : 


(shuffle [12345 6]) 
;; -> [314526] 
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阅 
java.util.Randonm 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/util/Random.html) 。 
10.3 市 “通过 随机 输入 进行 彻底 测试 ”。 


1.23 操作 货 


作者 : Ryan Neufeld 


. . Ny 


问题 
需要 操作 一 些 代表 货币 的 值 。 


使 用 Money 库 (https://github.com/clojurewerkz/money) 来 表示 、 操 作 和 存储 带 货币 单位 








要 继续 这 个 实例 ， 请 将 [clojurewerkz/money "1.4.0"] 加 入 项 目 依 赖 关 系 中 ， 或 用 Lein- 
try 开始 REPL: 


$ lein try clojurewerkz/money 
clojurewerkz.money.amounts 命名 空间 包含 了 创建 、 修 改 、 比 较 货币 单位 的 函数 : 


(require '[clojurewerkz.money.amounts :as ma]) 
(require '[clojurewerkz.money.currencies :as mc]) 


;; $2.00 in USD 

(def two (ma/amount-of mc/USD 2)) 
two 

;; -> #<Money USD 2.00> 


(ma/pLus two two) 
;; -> #<Money USD 4.00> 


(ma/minus two two) 
;; -> #<Money USD 0.00> 


(ma/< two (ma/amount-of mc/USD 2.01)) 
;; -> true 


(ma/total [two two two two]) 
;; -> #<Money USD 8.00> 





讨论 

操作 货币 是 严肃 的 事情 。 处 理 货币 时 ， 千 万 不 要 信任 内 建 的 数值 类 型 ， 尤 其 是 浮 点 类 型 。 
这 些 类 型 本 来 就 不 是 用 来 记录 和 操作 货币 的 ， 不 能 提供 要 求 的 语义 和 精度 。 特 别 是 IEEE 
754 标准 的 浮 点 值 在 设计 时 就 包含 了 一 定 的 不 精确 性 : 





























(- 0.23 0.24) 
;; -> -0.009999999999999981 











应 该 坚持 使 用 专门 为 处 理 货币 而 定制 的 库 。Money 库 封 装 了 值得 信任 的 、 经 过 实战 检验 的 
Java 库 Joda-Money。 除 了 运算 外 ，Money 还 提供 了 大 量 功 能 ， 包 括 舍 入 和 货币 转换 : 





(ma/round (ma/amount-of mc/USD 3.14) 0 :down) 
;; -> #<Money USD 3.00> 


(ma/convert-to (ma/amount-of mc/CAD 152.34) mc/USD 1.01696 :down) 
;; -> #<Money USD 154.92> 


round 函数 接受 4 个 参数 。 前 3 个 是 货币 的 数量 、 缩 放 因 子 和 人 铭 人 模式 。 缩 放 因子 是 个 有 
点 奇怪 的 参数 。 如 果 你 曾 用 BigDecimal 做 过 缩放 ， 可 能 对 此 有 点 熟悉 ， 它 也 有 一 样 的 缩 
放 因子 。 缩 放 因子 为 -1 表示 要 放大 10 倍 ，0 表示 1 倍 ， 等 等 。 进 一 步 的 细节 ， 可 以 查看 
Joda-Money 库 中 Money 类 的 rounded (http://joda-money.sourceforge.net/apidocs/src-html/org/ 
joda/money/Money.html#line.1173) 方法 的 javadoc 文档 。 最 后 一 个 参数 是 舍 人 模式 ， 有 几 
种 可 以 选择 。:ceiling 和 :floor 舍 入 的 方向 是 正 无 穷 或 负 无 穷 ，:up 和 :down 舍 入 的 方向 
是 靠近 或 远离 0。 最 后 ，:half-up、:half-down 和 :half-even 舍 入 的 方向 是 最 近 的 相 邻 数 ， 
分 别 是 向 上 、 向 下 或 等 距离 时 取 偶数 相 邻 数 。 





clojurewerkz.money.amounts/convert-to 是 简单 得 多 的 函数 。convert-to 接受 货币 数量 、 
目标 货币 、 转 换 因子 和 舍 入 模式 。Money 没有 提供 自己 的 转换 因子 ， 因 为 汇率 经 常 改变 ， 
所 以 需要 寻找 声誉 好 的 汇率 数据 来 源 。 不 幸 的 是 ， 这 一 点 我 们 帮 不 上 忙 。 











Money 也 支持 一 些 不 同 的 持久 和 序列 化 中 介 ， 包 括 Cheshire (https://github.com/dakrone/ 
cheshire) ， 实 现 与 JSON 的 相互 转换 ， 也 包括 Monger (http://clojuremongodb.info/)， 将 货 
币值 持久 到 MongoDB。 


参阅 
。 1.13 节 “ 利 用 非常 大 或 非常 小 的 数 来 保持 精度 ”， 以 及 1.16 节 “ 数 的 截断 和 伟人 ”。 


1.24 生成 唯一 ID 


作者 : Ryan Neufeld 
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问题 
需要 生成 唯一 ID。 


解决 方案 


使 用 Java 的 java.util.UUID/randomUUID 来 生成 通用 唯一 ID (UUID): 








(java.util.UUID/randomUUID) 
;; -> #uuid "5358e6e3-7f81-40f0-84e5-750e29e6ee05" 


(java.util.UUID/randomUUID) 
;; -> #uuid "a6f92a6f -f736-468f-9e26-f392852825f4" 


讨论 
在 构建 系统 时 ， 常 常 需要 为 对 象 或 记录 指定 唯一 的 ID。ID 通常 是 简单 的 整数 ， 随 时 间 间 
调 增长 。 但 这 样 做 并 非 没有 问题 。 


这 样 做 不 能 混合 不 同 来 源 的 对 象 的 ID ， 更 精 的 是 ， 它 们 揭示 了 数据 的 数量 和 输入 量 。 
这 时 就 需要 UUID。UUID 即 通用 唯一 标识 符 ， 它 是 128 位 的 随机 数字 ， 几 乎 在 整个 宇 























前 





Ve ee 

















中 都 是 唯一 的 。 当 然 ， 这 有 点 言 过 其 实 。 请 参考 RFC 4122 (http://www .ietf.org/rfc/rfc4122. 





txt)， 了 解 UUID 的 更 详细 信息 : 它们 如 何 生 成 以 及 背后 的 数学 原理 。 

















你 可 能 注意 到 ，Clojure 在 打印 UUID 时 ， 前 面 有 大 utd。 这 是 读 取 程 序 的 字面 值 标签 。 
作为 一 种 捷径 ， 让 Clojure 的 读 取 程 序 读 取 并 初始 化 UUID 对 象 。 读 取 程 序 字 面值 很 像 
符 串 字面 值 或 数字 字面 值 ， 如 "Hi" 或 42， 但 它们 能 记录 更 复杂 的 数据 类 型 。 




















它 
字 


这 使 得 edn (https://github.com/edn-format/edn， 可 扩展 数据 表示 法 ) 这 样 的 格式 能 够 以 共 








同 的 术语 沟通 、 交 换 UUID 这 样 的 对 象 ， 而 不 用 求助 于 字符 串 驻 留 (string interning) 以 
相应 的 定制 解析 逻辑 。 


及 





顺序 ID 
从 顺序 有 D 改 为 UUID, 会 表 失 一 种 可 能 ， 即 根据 随时 间 推 欧 而 增长 的 数字 来 排序 的 
可 能 。 如 果 生 成 的 UUID 既 唯 一 又 可 排序 ， 那 会 怎样 ? Datomic 用 它 的 datomic.api/ 
squuid 函数 ， 做 了 类 似 的 事情 
Datomic 的 squuid 近似 切 分 并 重新 组 合 了 随机 的 UUID， 使 用 bit-or 来 合并 当前 的 时 
间 和 UUID 中 最 重要 的 32 位 。 然 后 利用 java.util.UUID 的 构造 方法 将 这 两 部 分 UUID 
重新 组 合 起 来 ， 得 到 了 按时 间 顺 序 增长 的 UUID: 














(def first (squuid)) 
first 

;; -> #uuid "527bf210-dfae-4c73-8b7a-302d3b511f41" 
(def second (squuid)) 

second 

;; -> #uuid "527bf219-65f0-4241-a165-c5c541cb98ea" 
(def third (squuid)) 

third 

;; -> #uuid "527bf232-42b2-44bc-8dd7-ddae2abfcb87" 
(sort [first second third]) 

;; -> (#uutd "527bf210-dfae-4c73-8b7a-302d3b511f41" 
3 #uuid "527bf219-65f0-4241-a165-c5c541cb98ea" 
3 #uuid "527bf232-42b2-44bc-8dd7-ddae2abfcb87") 











参阅 

。 121 节 “ 位 操作 ”。 

。 1.26 闻 “ 用 字面 值 来 表示 日 期 ”, 探讨 了 #inst, 另 一 个 读 取 程 序 的 例子 , 用 来 表示 日 期 。 
。 java.util.UUID 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/util/UUID.html)。 


1.25 ”得 到 当前 的 日 期 和 时 间 


作者 : Ryan Neufeld 























需要 得 到 当前 的 日 期 或 时 间 。 


解决 方案 
使 用 Java 的 java.util.Date (http://docs.oracle.com/javase/7/docs/api/java/util/Date.html) 构 
造 方法 ， 创 建 一 个 Date 实例 ， 代 表 当 前 的 时 间 和 日 期 





(defn now [] 
(java.util.Date.)) 


(now) 
;; -> #inst "2013-04-06T14:33:45.740-00:00" 
;; 儿 秒 钟 后 …… 


(now) 
-> #inst "2013-04-06T14:33:51.234-00:00" 


P| 
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如 果 对 当前 的 Unix 时 间 惟 更 感 兴 趣 ， 请 使 用 System/currentTimeMillis. 


(System/currentTimeMillis) 
;; -> 1365260110635 


(System/currentTimeMillis) 
;; -> 1365260157013 


讨论 
对 于 Clojure 来 说 ， 重 新 实现 或 包装 JVM 的 时 间 和 日 期 功能 没有 太 大 意义 。 因 此 ， 正 常 的 
做 法 是 利用 Clojure 的 Java 互 操作 形式 ， 实 例 化 一 个 Date 对 象 来 表示 “现在 ”。 








#inst "2013-04-06T14:33:51.234-00:00" 看 起 来 不 太 像 Java， 对 吗 ? 这 是 因为 Clojure 的 
“时 刻 ” 读 取 程 序 字面 值 使 用 了 java.util.Date 作为 其 后 台 实 现 ， 在 1.26 节 “ 用 字面 值 来 
表示 日 期 ”中 ， 我 们 探讨 了 更 多 关于 机 nst 读 取 程序 字面 值 的 内 容 。 












































对 于 执行 一 次 性 的 基准 测试 ， 使 用 System/currentTimeMiLtLis 可 能 很 有 用 ， 但 既然 有 一 些 
高 品质 的 工具 来 做 这 件 事 ，currentTimeMillis 的 作用 就 有 限 了 。 如 果 要 做 基准 测试 ， 也 许 
可 以 试 试 Hugo Duncan 的 Criterium 库 (https:Wgithub.com/hugoduncan/criterium ) 。 另 外 ， 不 
应 该 使 用 currentTimeMiLLis 作为 某 种 唯一 的 值 ，UUID 是 更 好 的 选择 。 








如 果 决 定 使 用 clj-time (https://github.com/clj-time/clj-time) 来 处 理 日 期 ， 它 提供 cUj- 
time.core/now 来 取得 当前 的 DateTime: 


(require '[clj-time.core :as timec]) 


(timec/now) 
-> #<DateTime 2013-04-06T14:35:15.453Z> 


通过 clj-time.local/local-now 取得 的 DateTime 实例 ， 代 表 机 器 本 地 时 区 的 当前 时 间 : 


(require '[clj-time.local :as timel]) 


(timel/local-now) 
-> #<DateTime 2013-04-06T09:35:20.141-05:00> 


9 


阅 
1.24 节 “ 生 成 唯一 ID”， 探 讨 了 如 何 生成 通用 唯一 ID。 
1.26 节 “ 用 字面 值 来 表示 日 期 "”， 探 讨 了 #inst 读 取 程序 常 的 更 多 信息 。 


1.26 用 字面 值 来 表示 日 期 


作者 : Ryan Neufeld 














“Ww 
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问题 
需要 将 时 间 实 例 表 示 成 可 读 的 、 可 序列 化 的 形式 。 
解决 方案 


使 用 Clojure 的 机 nst 字面 值 来 表示 某 个 时 间 点 : 

















(def ryans-birthday #inst "1987-02-18T18:00:00.000-00:00") 


(println ryans-birthday) 

;; *OUut* 

;; #inst "1987-02-18T18:00:00.000-00:00" 
如 果 与 其 他 Clojure 进程 通信 (或 任何 使 用 edn (https://github.com/edn-format/edn) 的 进 
程 )， 请 使 用 clojure.edn/read， 将 时 刻字 面值 字符 串 实 例 化 为 Date 对 象 : 























;; 一 个 假想 的 通信 通道 ，" 接收 "edn 字符 串 
(require 'clojure.edn) 
(import '[java.io PushbackReader StringReader]) 


(defn remote-server-receive-date [] 
(-> "#inst \"1987-02-18T18:00:00.000-00:00\"" 
(StringReader.) 
(PushbackReader .))) 


(clojure.edn/read (remote-server-receive-date)) 
;; -> #inst "1987-02-18T18:00:00.000-00:00" 











在 前 面 的 例子 中 ，remote-server-receive-date 模拟 了 一 个 通信 通道 ， 通 过 它 接收 edn 
数据 。 


讨论 

从 Clojure 1.4 开始 ， 时 刻 是 通过 大 nst 读 取 程序 字面 值 来 表示 的 。 这 意味 着 日 期 不 再 用 代 
a DT 而 是 有 文本 表示 形式 ， 既 一 致 ， ie i EL edn 进 
行 通信 的 进程 ， 这 个 标准 允许 它们 清楚 地 说 出 时 刻 。 支 持 edn 的 语言 列表 参见 edn 的 实现 
列表 (https://github.com/edn-format/edn/wiki/Implementations)， 目 前 包括 Clojure、Ruby 和 
JavaScript， 还 有 很 多 实现 正在 进行 之 中 。 


























clojure.core/read 与 clojure.edn/read 
虽然 用 Clojure 内 建 的 读 取 程序 (clojure.core/read) 似乎 比较 方便 ， 但 用 这 个 读 取 程 
序 从 不 信任 的 来 源 解 析 输 入 数据 是 不 安全 的 。 如 果 需 要 从 外 部 来 源 读 取 简 单 的 Clojure 
数据 ， 最 好 是 使 用 edn 读 取 程序 (clojure.edn/read)， 
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clojure.core/read 不 安全 是 因为 其 设计 仅 针 对 从 信任 的 来 源 (比如 你 写 的 源 文 件 ) 读 
取 Clojure 数据 和 字符 事 。clojure.edn/read 的 设计 特别 针对 使 用 通信 通道 的 情况 ， 设 
计时 考虑 了 安全 性 。 








也 有 可 能 改变 数据 读 取 程 序 ， 从 而 改变 实例 化 大 nst 字面 值 的 方式 。 如 果 需 要 ， 可 以 通过 
改变 数据 读 取 程序 ， 将 #nst 字面 值 实例 化 为 java.util.Calendar (http://docs.oracle.com/ 
javase/7/docs/api/java/util/Calendar.html) 或 java.sql.Timestamp (http://docs.oracle.com/javase/7/ 


























docs/api/java/sql/Timestamp.html) : 
(def instant "#inst \"1987-02-18T18:00:00.000-00:00\"") 
(binding [*data-readers* {'inst clojure.instant/read-instant-calendar}] 
(class (read-string instant))) 
;; -> java.util.GregorianCalendar 
(binding [*data-readers* {'inst clojure.instant/read-instant-timestamp}] 


(class (read-string instant))) 
;; -> java.sql.Timestamp 


阅 
1.24 节 “ 生 成 唯一 ID”， 探 讨 了 Clojure 中 读 取 程序 字面 值 的 另 一 个 例子 。 


1.27 利用 clj-time 解 析 日 期 和 时 间 


作者 : Ryan Neufeld 


Wh 




















问题 
需要 从 字符 串 中 解析 日 期 。 


解决 方案 

直接 使 用 Java 的 日 期 和 时 间 类 就 像 拔牙 一 样 痛苦 。 我 们 建议 使 用 clj-time (https://github. 
com/clj-time/clj-time)， 它 是 优秀 的 Joda-Time 库 (http://joda-time.sourceforge.net/) 的 Clojure 
包装 。 








开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [clj-time "9.6.9"]， 或 用 lein-try 开始 REPL: 





$ lein try clj-time 


用 clj-time.format/formatter 来 创建 定制 的 日 期 /时 间 表示 格式 ， 能 够 解析 待 处 理 的 字符 
串 。 调 用 clj-time.format/parse， 带 上 这 些 定制 的 格式 ， 将 字符 串 解析 成 DateTime 对 象 : 








| 大 
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(require '[clj-time.format :as tf]) 


;; 解析 "92/18/87" 这 样 的 日 期 
(def government-forms-date (tf/formatter "MM/dd/yy")) 





(tf/parse government-forms-date "02/18/87") 
;; -> #<DateTime 1987-02-18T00:00:00.000Z> 


(def wonky-format (tf/formatter "HH:mm:ss:SS' on 'yyyy-MM-dd")) 
;; -> #'User/wonky-format 


(tf/parse wonky-format "16:13:49:06 on 2013-04-06") 
;; -> #<DateTime 2013-04-06T16:13:49.060Z> 


讨论 

formatter 函数 是 一 个 强大 的 小 函数 ， 接 受 日 期 /时 间 格 式 字符 串 ， 返 回 一 个 对 象 ， 该 对 象 
能 解析 那 种 格式 的 日 期 /时 间 字 符 串 。 这 种 格式 字符 串 用 符号 来 表示 时 间或 日 期 的 各 个 部 
分 ， 而 且 能 够 包含 任意 数量 的 符号 。 符 号 的 例子 包括 年 ("yy" 或 "yyyy")、 日 ("dd")， 其 
至 是 字面 值 字符 串 ， 如 "on"。 这 些 符号 的 完整 列表 请 参见 Joda-Time 的 DateTimeFormat 的 


javadoc 文档 (http://joda-time.sourceforge.net/apidocs/org/joda/time/format/DateTimeFormat.html ) 。 


























更 常见 的 情况 是 ， 要 解析 的 日 期 和 时 间 有 点 奇怪 ， 但 又 不 是 奇怪 到 从 来 没 人 见 过 。 对 此 ， 
clj-time 包含 了 大 量 的 内 建 格 式 。 调 用 clj-time.format/show-formatters 可 以 打印 出 内 建 
格式 的 列表 ， 以 及 每 种 格式 的 示例 日 期 /时 间 。 如 果 选 定 了 一 种 合适 的 格式 ， 就 可 以 调用 
cLj-time.format/formatters， 带 上 它 的 关键 字 作为 参数 ， 得 到 相应 的 DateTimeFormatter 。 




















默认 情况 下 ，formatter 总 是 将 字符 串 解析 成 DateTime 对 象 ， 并 带 有 UTC 时 区 。Formatter 
的 第 二 个 参数 是 可 选 的 ， 表 示 时 区 。 可 以 用 clj-time.core/time-zone-for-offset 或 clj- 
time.core/time-zone-for-id 得 到 一 个 DateTimeZone 对 象 ， 传 递 给 formatter。 








参阅 

。 1.28 节 “ 利 用 cUj-time 格式 化 日 期 ”， 探 讨 了 如 何 利用 格式 类 得 到 字符 串 。 

。 Java 简单 日 期 格式 类 的 官方 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/text/ 
SimpleDateFormat.html) a 


1.28. 利用 clj-time 格 式 化 日 期 


作者 : Ryan Neufeld 





问题 
需要 以 特定 格式 打印 日 期 或 时 间 。 
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解决 方案 
虽然 可 以 利用 clojure.core/format 来 格式 化 Java 日 期 相关 的 一 些 实例 (Date、Calendar 
和 Timestamp)， 但 应 该 使 用 clj-time (https://github.com/clj-time/clj-time) 来 格式 化 日 期 。 


开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [clj-time "6.6.0"]， 或 用 Lein-try 开始 REPL : 





$ lein try clj-time 


要 将 日 期 /时 间 输 出 为 字符 串 ， 请 调用 clj-time.format/unparse， 并 带 上 一 个 DateTimeFormatter 
参数 。 有 一 些 内 建 的 格式 ， 可 以 通过 clj-time.format/formatters 获得 ， 或 者 也 可 以 利用 
clj-time.format/formatter， 建 立 自己 的 格式 : 





(require '[clj-time.format :as tf]) 
(require '[clj-time.core :as t]) 


(tf/unparse (tf/formatters :date) (t/now)) 
;; -> "2013-04-06" 


(def my-format (tf/formatter "MMM d, yyyy 'at' hh:mm")) 
(tf/unparse my-format (t/now)) 
;; -> "Apr 6, 2013 at 04:54" 


讨论 

当然 有 可 能 格式 化 纯 的 Java 日 期 和 时 间 ， 但 根据 我 们 的 经 验 ， 不 值得 这 么 麻烦 : 语法 又 难 
看 ， 步 又 又 繁琐 。cUj-time 及 其 背后 的 Joda-Time 库 有 很 好 的 表现 记录 ， 让 JVM 环境 下 的 
日 期 和 时 间 处 理 变 得 容易 。 

















formatter 国 数 是 个 好 东西 。 它 不 仅 能 得 到 一 个 “格式 ”， 用 于 打印 或 反 解 析 日 期 ， 也 能 够 将 
字符 串 解 析 成 日 期 对 象 。 换 言 之 ，DateTimeFormatter 能 够 在 字符 串 和 Date 之 间 来 回转 换 。 
1.27 节 “ 利 用 clj-time 解析 日 期 和 时 间 ” 介 绍 了 formatter 和 formatters 的 许多 工作 原理 。 


有 一 种 格式 符号 在 解析 时 用 得 不 多 ， 它 就 是 星期 儿 的 文本 表示 (如 "Tuesday" 或 "Tue")。 
在 格式 字符 串 中 用 "E" 来 表示 星期 几 的 缩写 ， 用 "EEEE" 来 表示 全 称 : 











(def abbr-day (tf/formatter "E")) 
(def full-day (tf/formatter "EEEE")) 


(tf/unparse abbr-day (t/now)) 
;; -> "Mon" 

(tf/unparse full-day (t/now)) 
;; -> "Monday" 


如 果 需 要 格式 化 原生 的 Java 日 期 /时 间 实 例 ， 可 以 使 用 clj-time.coerce 命名 空间 中 的 函 
数 ， 将 Java 日 期 /时 间 实 例 强制 转换 成 Joda-Time 实例 : 
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(require '[clj-time.coerce :as tc]) 


(tc/from-date (java.util.Date.)) 


;; -> #<DateTime 2013-04-06T17:03:16.872Z> 











类 似 地 ， 也 可 以 使 用 clj-time.coerce， 将 Joda-Time 实例 强制 转换 成 其 他 格式 : 


(tc/to-date (t/now)) 


;; -> #inst "2013-04-06T17:03:57.239-00:00" 


(tc/to-long (t/now)) 
;; -> 1365267761585 


参阅 


。 GitHub 上 的 clj-time 项 目 主页 (https://github.com/clj-time/clj-time)。 





。 1.27 节 “利用 clj-time 解析 日 期 和 时 间 ” ,探讨 了 formatter 和 formatters 的 更 多 细节 。 
。 Java 简单 日 期 格式 类 的 官方 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/text/ 





SimpleDateFormat.html) 


1.29 比较 日 期 


作者 : Ryan Neufeld 


问题 
需要 比较 两 个 日 期 ， 或 需要 按 日 期 排序 。 


解决 方案 


可 以 利用 compare 函数 比较 Java 的 Date 对 象 : 


(defn now [] (java.util.Date.)) 
(def one-second-ago (now)) 
(Thread/sleep 1000) 


;; 现在 比 一 秒 前 大 (1) 
(compare (now) one-second-ago) 
;; ->1 





;; 一 秒 前 比 现在 小 (-1) 
(compare one-second-ago (now)) 
;; -> -1 





;;" 相等 " 用 9 表示 





(compare one-second-ago one-second-ago) 


;; ->0 
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讨论 
为 什么 不 用 Clojure 内 建 的 比较 操作 符 (<=、> 等 ) 来 比较 日 期 ? 这 些 操作 符 的 问题 在 于 ， 
它们 利用 了 clojure.lang.Numbers， 并 试图 将 它们 的 参数 强制 转换 成 数值 类 型 。 


既然 常规 的 比较 不 行 ， 就 有 必要 用 compare 函数 。compare 函数 接受 两 个 参数 ， 返 回 一 个 数 
值 ， 表明 第 一 个 参数 小 于 (-1)、 等 于 (0) 或 大 于 (+1) 第 二 个 参数 。 


Clojure 的 sort 函数 背后 调用 了 compare， 所 以 对 日 期 集合 排序 不 需要 额外 的 工作 : 

















(def occurrences 
[#inst "2013-04-06T17:40:57.688-00:00" 
#inst "2002-12-25T00:40:57.688-00:00" 
#inst "2025-12-25T11:23:31.123-00:00"]) 


(sort occurrences) 

;; -> (#inst "2002-12-25T00:40:57.688-00:00" 
3 #inst "2013-04-06T17:40:57.688-00:00" 
pe #inst "2025-12-25T11:23:31.123-00:00") 

















如 果 已 经 对 日 期 和 时 间 做 过 更 复杂 的 工作 ， 并 且 拥 有 Joda-Time 对 象 ， 那 么 所 有 这 些 仍然 
有 效 。 但 是 ， 如 果 需 要 比较 Joda-Time 对 象 和 Java 时 间 对 象 ， 就 必须 用 clj-time.coerce 
中 的 函数 ， 将 它们 强制 转换 成 统一 的 类 型 。 





参阅 
。 2.24 节 “ 值 的 比较 与 排序 ”。 

M3 M3 Mg 吾 pe 
1.30 ”计算 时 间 间 隔 的 长 度 
作者 : Ryan Neufeld 
问题 
需要 计算 两 个 时 间 点 之 间 的 差 值 。 
解决 方案 


由 于 Java 的 日 期 和 时 间 类 对 时 区 和 闽 年 的 支持 很 弱 ， 所 以 用 clj-time 库 (https://github. 
com/clj-time/clj-time) 来 计算 时 间 间 隔 的 长 度 。 

















开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [ctlj-time "0.6.0"]， 或 用 Lein-try 开始 REPL : 


$ lein try clj-time 


使 用 clj-time.core 命名 空间 中 的 interval 和 众多 的 in-<unit> 辅助 函数 ， 来 计算 两 个 时 
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间 点 之 间 的 差 值 : 











(require '[clj-time.core :as t]) 


;; 第 一 步 是 将 两 个 日 期 作为 一 个 interval 记录 下 来 
(def since-april-first 
(t/interval (t/date-time 2013 04 01) (t/now))) 


;; dt 是 2013 年 恩人 节 到 今天 之 间 的 间隔 
since-april-first 
;; -> #<Interval 2013-04-01T00:00:00.000Z/2013-04-06T20:06:30.507Z> 





(t/in-days since-april-first) 
;; ->5 


;; 自 登 月 以 来 的 年 数 
(t/in-years (t/interval (t/date-time 1969 07 20) (t/now))) 
;; -> 43 


;; 2012 年 2 月 28 日 到 3 月 1 日 之 间 的 天 数 (图 年 ) 
(t/in-days (t/interval (t/date-time 2012 02 28) 
(t/date-time 2012 03 01))) 


2 





;; 平年 的 情况 
(t/in-days (t/interval (t/date-time 2013 02 28) 
(t/date-time 2013 03 01))) 








i 


讨论 

计算 时 间 间 隔 的 长 度 是 比较 复杂 的 时 间 操 作 。 地 球 上 的 时 间 是 一 只 复杂 的 怪兽 ， 因 为 半年 
和 时 区 等 结构 而 变 得 复杂 。 据 我 们 所 知 ，cLj-time (https://github.com/clj-time/clj-time) 是 
唯一 能 对 付 这 种 复杂 性 的 库 。 

clj-time.core/interval 国 数 接受 两 个 日 期 ， 返 回 离散 的 时 间 间 隔 的 表示 形式 。 而 clj-time. 
core 命名 空间 包含 了 大 量 的 in-<unit> 函数 ， 可 以 用 不 同 的 单位 来 表示 这 段 时 间 间 隔 。 这 些 
辅助 函数 的 范围 从 in-msecs 到 in-years ,涵盖 了 一 般 应 用 程序 中 几乎 所 有 有 用 的 时 间 单 位 。 
































clj-time 不 支持 的 一 项 功能 是 靖 秒 。Joda-Time 的 官方 FAQ (http://joda-time.sourceforge. 
net/faq.html) 解释 了 为 什么 没有 这 项 功能 。 我 们 没有 发 现任 何 Clojure 库 能 在 这 样 的 粒度 上 
推演 时 间 。 如 果 这 让 你 不 爽 ， 那 么 你 可 能 是 少数 几 个 能 把 这 事 做 对 的 人 。 视 你 好 运 。 








参阅 

。 1.29 节 “ 比 较 日 期 ”。 

。 1.31 节 “ 生 成 一 系列 的 日 期 和 时 间 ”。 
。 1.33 节 “ 根 据 日 期 间 的 关系 取得 日 期 ”。 





原生 数据 | 47 


1.31 生成 一 系列 的 日 期 和 时 间 


作者 : Ryan Neufeld 


问题 
需要 生成 一 个 惰性 序列 (lazy sequence) ， 包 含 一 系列 的 日 期 和 (或) 时 间 。 


解决 方案 

这 个 问题 在 Java 中 没有 容易 的 解决 方案 ， 在 Clojure 中 也 没有 ， 包 括 第 三 方 的 库 。 但 是 ， 
可 以 通过 clj-time (https://github.com/clj-time/clj-time) 来 近似 。 通 过 组 合 使 用 cLj-time 的 
Interval 和 periodic-seq 功能 ， 可 以 创建 一 个 函数 time-range， 模 拟 range 的 功能 ， 但 针 
对 的 是 DateTime : 


(require '[clj-time.core :as time]) 
(require '[clj-time.periodic :as time-period]) 


(defn time-range 
"Return a lazy sequence of DateTimes from start to end, incremented 
by 'step' units of time." 
[start end step] 
(let [inf-range (time-period/periodic-seq start step) 
below-end? (fn [t] (time/within? (time/interval start end) 
t))] 
(take-while below-end? inf -range))) 





下 面 是 time-range 函数 的 用 法 : 











(def months-of -the-year (time-range (time/date-time 2012 01) 
(time/date-time 2013 01) 
(time/months 1))) 


;; months-of -the-year 是 未 实现 的 惰性 序列 
(realized? months-of-the-year) 
;; -> false 


(count months-of -the-year) 
;; -> 12 


;; 现在 实现 了 
(realized? months-of -the-year) 
;; -> true 





讨论 
在 Clojure 中 ， 尽 管 没 有 准备 好 的 、 立 即 可 用 的 time-range 解决 方案 ,但 创建 这 样 一 个 具 
备 纯 惰 性 语义 的 函数 并 不 困难 。 我 们 的 惰性 time-range 函数 的 基础 是 一 个 无 限 的 值 序列 ， 









































从 一 个 固定 的 时 间 开 始 : 





(defn time-range 
"Return a lazy sequence of DateTimes from start to end, incremented 
by 'step' units of time." 
[start end step] 


(let [inf-range (time-period/periodic-seq start step) 2 
below-end? (fn [t] (time/within? (time/interval start end) ; 
t))] 
(take-while below-end? inf-range))) ;© 


@ 取得 一 个 惰性 无 限 序列 。 
@ 创建 一 个 谓词 来 终止 该 序列 。 
四 修改 该 序列 ， 当 below-end? 失败 时 终止 (当然 也 是 惰性 的 )。 





de 





调用 periodic-seq， 带 上 start 和 step， 就 会 返回 一 个 无 限 的 情 性 值 序列 ， 从 start 开始 ， 
下 一 个 值 比 上 一 个 值 增长 一 个 step。 


拥有 情 性 序列 是 一 回 事 ， 但 我 们 还 需要 一 种 惰性 的 方式 ， 在 到 达 end 时 停止 取 值 。 在 Let 
中 创建 的 below-end? 畏 数 利用 cUj-time.core/intervaL 来 构建 从 start 到 end 的 时 间 间 
隔 ， 并 用 clj-time.core/within? 来 测试 时 间 t 是 否 在 这 个 间隔 之 内 。 这 个 函数 被 当 作 谓 
词 传 递 给 take-white， 它 将 情 性 地 消费 这 些 值 ， 直 到 below-end? 失败 。 

















总 之 ，time-range 返回 一 个 惰性 的 DateTime 对 象 序列 ， 从 一 个 开始 时 间 到 一 个 结束 时 间 ， 
步 长 是 提供 的 step 值 。 


想象 一 下 ， 用 一 种 不 具备 一 级 惰性 的 语言 来 构建 类 似 的 东西 会 是 什么 结果 。 



































参阅 

。 1.29 节 “ 比 较 日 期 ”。 

。 1.30 节 “ 计 算 时 间 间 隔 的 长 度 ”。 

1.32 节 “ 利 用 原生 Java 类 型 生成 一 系列 日 期 和 时 间 ”， 探 讨 了 另 一 种 只 使 用 原生 类 型 的 方式 。 
。 1.33 节 “ 根 据 日 期 间 的 关系 取得 日 期 ”。 


1.32 利用 原生 Java 类 型 生成 一 系列 日 期 和 时 间 


作者 : Tom Hicks 


\ 


问题 
需要 生成 一 个 惰性 序列 ， 包 含 一 系列 的 日 斯 和 时 间 。 而 且 ， 不 像 1.31 节 那 样 ， 而 是 希望 只 
用 内 建 的 类 型 。 








解决 方案 

可 以 使 用 Java 的 java.util.GregorianCalendar 类 (http://docs.oracle.com/javase/7/docs/api/ 
java/util/GregorianCalendar.html)， 加 上 Clojure 的 repeatedly 函数 ， 生 成 格 里 高 利 日 历 日 
期 的 惰性 序列 。 然 后 用 java.text.SimpLeDateFormat (http://docs.oracle.com/javase/7/docs/ 
api/java/text/SimpleDateFormat.html) 来 格式 化 这 些 日 期 ， 有 大 量 输出 格式 可 选 。 


这 个 例子 生成 了 格 里 高 利 “ 日 历 日 期 的 无 限 惰性 序列 ， 从 1970 年 1 月 1 日 开始 ， 一 天 接 一 
然后 用 核心 的 take 和 drop 函数 ， 选 择 2 月 的 最 后 两 天 (注意 ， 不 要 在 REPL 中 对 无 
序列 估 值 ) : 











(def daily-from-epoch 
(Let [start-date (java.util.GregorianCalendar. 1970 00 0 0)] 
(repeatedly 


(fn [] 
(.add start-date java.util.Calendar/DAY_OF_YEAR 1) 
(.clone start-date))))) 


(take 2 (drop 57 daily-from-epoch)) 
;; -> (#inst "1970-02-27T00:00:00.000-07:00" 
ce #inst "1970-02-28T00:00:00.000-07:00") 


讨论 
Clojure 没有 自己 的 日 期 类 型 ， 默 认 情 况 下 ， 它 靠 的 是 容易 与 Java 互 操作 的 能 力 (但 请 参 
考 clj-tine 库 ， 它 提供 了 Java 日 期 、 时 间 和 日 历 类 的 赫 代 )。 


个 解决 方案 基于 核心 的 repeatedly 函数 ， 它 通过 重复 调用 传 给 它 的 参数 函数 ， 得 到 一 个 
人 就 是 函数 的 返回 结果 构成 的 序列 。 因 为 没有 向 repeatedly 提供 可 选 的 、 有 限 
的 参数 ， 所 以 结果 序列 是 无 限 的 。 因 此 ， 在 REPL 环境 中 ， 必 须 谨慎 地 在 上 下 文中 (例如 
take 和 drop) 评估 结果 序列 ， 限 制 生 成 的 值 。 


因为 向 repeatedly 提供 的 函数 是 没有 参数 的 ， 所 以 假定 是 通过 副作用 来 实现 它 的 目标 (这 
使 它 成 为 非 纯 函数 )。 这 里 ， 当 参数 函数 创建 一 个 格 里 高 利 日 历 ， 并 反复 地 让 它 以 一 天 为 
单位 递增 时 ， 非 纯 就 发 生 了 。 每 次 调用 该 函数 ， 它 返回 那个 格 里 高 利 日 历 对 象 的 拷贝 (为 
了 避免 神秘 的 、 不 期 望 的 副作用 ， 建 议 不 要 直接 返回 那个 变化 的 对 象 ) 。 





























结果 序列 中 的 日 期 值 是 java.util.GregorianCalendar 类 型 ， 但 REPL 的 print 国 数 将 它们 
显示 为 #inst 读 取 程序 字面 值 。 可 以 将 class (或 type) 函数 映射 到 这 个 序列 上 ， 验 证 该 
序列 的 元 素 是 格 里 高 利 日 历 对 象 : 
































注 4:“ 格 里 高 利 ” 是 我 们 都 知道 而 且 喜 欢 的 日 历 的 正式 名 称 。 更 多 内 容 请 参考 维基 百科 (http://en.wikipedia. 


org/wiki/ Gregorian_calendar) 2 





(def end-of-feb (take 2 (drop 57 daily-from-epoch))) 
(map class end-of-feb) 
;; -> (java.util.GregorianCalendar java.util.GregorianCalendar) 


可 以 将 这 个 解决 方案 一 般 化 ， 变 成 一 个 接受 一 个 起 始 年 份 参数 的 函数 ， 但 如 果 没 提供 该 参 
数 ， 就 默认 为 某 个 方便 的 年 份 : 


(defn daily-from-year [& [start-year]] 
(let [start-date (java.util.GregorianCalendar. (or start-year 1970) 
0 0 00)] 
(repeatedly 
(fn [] 
(.add start-date java.util.Calendar/DAY_OF_YEAR 1) 
(.clone start-date) )))) 


(take 3 (daily-from-year 1999)) 

;; -> (#inst "1999-01-01T00:00:00.000-07:00" 
En #inst "1999-01-02T00:00:00.000-07:00" 
2 #inst "1999-01-03T00:00:00.000-07:00") 


(take 2 (daily-from-year)) 
;; -> (#inst "1970-01-01T00:00:00.000-07:00" 
Ss #inst "1970-01-02T00:00:00.000-07:00") 


利用 java.text.SimpleDateFormat 类 ， 可 以 将 日 期 格式 化 为 各 种 不 同 的 格式 : 


(def end-of-days (take 3 (drop 353 (daily-from-year 2012)))) 
(def cal-format (java.text.SimpleDateFormat. "EEE M/d/yyyy")) 
(def iso8601-format (java.text.SimpleDateFormat. "yyyy-MM-dd'T'HH:mm:ss'Z'")) 


(map #(.format cal-format (.getTime %)) end-of-days) 
;; -> ("Wed 12/19/2012" "Thu 12/20/2012" "Fri 12/21/2012") 


(map #(.format iso8601-format (.getTime %)) end-of-days) 
;; -> ("2012-12-19T00:00:00Z" "2012-12-20T00:00:00Z" "2012-12-21T00:00:00Z") 


综合 起 来 ， 创 建 一 个 函数 来 生成 无 限 惰性 序列 ， 包 含 格式 化 的 格 里 高 利 日 期 字符 串 。 为 了 
方便 ， 该 函数 接受 可 选 的 起 始 年 份 和 日 期 格式 字符 串 参 数 : 





(defn gregorian-day-seq 
"Return an infinite sequence of formatted Gregorian day strings 
starting on January 1st of the given year (default 1970)" 
[& [start-year date-format]] 
(let [gd-format (java.text.SimpleDateFormat. (or date-format "EEE M/d/yyyy")) 
start-date (java.util.GregorianCalendar. (or start-year 1970) 0 0 0 0)] 
(repeatedly 
(fn [] 
(.add start-date java.util.Calendar/DAY_OF_YEAR 1) 
(.format gd-format (.getTime start-date)) )))) 

















要 测试 该 函数 ， 找 到 一 年 中 所 有 的 星期 日 ， 再 选 出 最 后 一 个 。 
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(def y2k (take 366 (gregorian-day-seq 2000))) 
(Last (filter #(.startsWith % "Sun") y2k)) 
;; -> "Sun 12/31/2000" 


1.25 节 “ 得 到 当前 的 日 期 和 时 间 ”， 探 讨 了 在 Clojure 中 使 用 java.util.Date。 

1.26 节 “ 用 字面 值 来 表示 日 期 ”， 介 绍 了 Clojure 中 针对 日 期 /时 间 的 上 nst 读 取 程序 字 

面值 。 
。 1.31 节 “ 生 成 一 系列 的 日 期 和 时 间 ”， 人 介绍 了 另 一 种 使 用 clj-time/Joda-Time 的 方法 。 


1.33 根据 日 期 间 的 关系 取得 日 期 


作者 : Ryan Neufeld 



































问题 
需要 根据 某 个 时 间 来 算出 另 一 个 时 间 ， 就 像 Ruby on Rails (http://rubyonrails.org/) 中 的 


2.days.from_now。 


解决 方案 
因为 相对 时 间 是 一 只 复杂 的 怪兽 ， 所 以 我 们 建议 用 clj-time (https://github.com/clj-time/clj- 
time) 来 计算 相对 日 期 和 时 间 。 


开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [ctlj-time "6.6.0"]， 或 用 Lein-try 开始 REPL : 





$ lein try clj-time 


如 果 你 用 过 Ruby on Rails 框架 ,那么 可 能 熟悉 这 样 的 语句 : 1.day.from_now，3.days.ago 
或 some_date - 2.years。 你 会 很 高 兴 clj-time 提供 了 类 似 的 功能 : 





(require '[clj-time.core :as t]) 


;; 1.day.from_now ( 写 这 个 程序 是 在 4 月 6 号 ) 
(-> 1 

t/days 

t/from-now) 
;; -> #<DateTime 2013-04-07T20:36:52.012Z> 


;; 3.days.ago 
(-> 3 
t/days 
t/ago) 
;; -> #<DateTime 2013-04-03T20:37:06.844Z> 





clj-time.core 的 国 数 from-now 和 ago 只 是 语法 糖 ， 背 后 是 plus 和 minus : 


;; 1.day.from now 


(t/plus (t/now) (t/years 1)) 
;; -> #<DateTime 2014-04-06T20:41:43.638Z> 


;; Some date - 2.years 

(def some-date (t/date-time 2053 12 25)) 
(t/minus some-date (t/years 2)) 

;; -> #<DateTime 2051-12-25T00:00:00.000Z> 


讨论 
尽管 日 期 和 时 间 处 理 有 时 候 在 Java 中 很 难 ， 但 ctj-tine 设法 提供 了 容易 的 语法 ， 实 现 日 
期 的 加 减 。 


























国 数 plus、minus、from-now 和 ago 都 接受 一 段 时 间 间 隔 ， 并 根据 它 来 调整 一 个 DateTime 
(这 个 时 间 可 以 是 “现在 ”， 就 像 在 from-now 或 ago 中 那样 ， 也 可 以 是 某 个 给 定 的 时 间 点 )。 


clj-tine.core 包含 了 一 些 有 用 的 时 间 间 隔 辅 助 类 ， 从 mtLts 到 years， 以 给 定 的 尺度 给 出 
时 间 间 隔 。 


根据 使 用 情况 ， 甚 至 可 以 将 操作 、 时 间 间 隔 和 时 间 巧 妙 地 加 以 安排 ， 读 起 来 就 像 一 句 话 。 





以 (-> 1 t/years t/from-now) 为 例 。 在 这 个 例子 中 ， 线 索 宏 -> 将 值 串 起 来 ， 每 个 作为 后 
一 个 的 参数 ， 得 到 (t/from-now (t/years 1))。 





可 以 根据 自己 的 喜好 ， 安 排 函 数 调用 ， 但 要 知道 ， 完 全 能 够 像 这 样 产 生 可 读 的 、 深 度 虞 人 套 
的 调用 。 
参阅 


。 1.29 市 “比较 日 期 "。 
。 1.31 市 “生成 一 系列 的 日 期 和 时 间 ”。 


1.34 ”处 理 时 区 


作者 : Ryan Neufeld 


问题 
需要 优雅 地 处 理 一 些 时 区 中 的 时 间 和 日 期 。 
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解决 方案 

JVM 内 建 的 时 间 和 日 期 类 与 时 区 的 表示 法 配合 不 好 。 比 如 说 ，Date 将 每 个 值 都 当成 UTC， 
而 Calendar 在 Clojure 中 用 起 来 麻烦 (或 者 说 在 Java 中 ， 就 这 件 事 来 说 )。 请 用 clj-time 
(https://github.com/clj-time/clj-time) 来 适当 地 处 理 时 区 。 


























开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [clj-time "9.6.0"]， 或 用 lein-try 开始 REPL: 





$ lein try clj-time 
(require '[clj-time.core :as t]) 
;; 我 的 生日 ， 在 正确 的 时 区 


(def bday (t/from-time-zone (t/date-time 2012 02 18 18) 
(t/time-zone-for-offset -6))) 








bday 
;; -> #<DateTime 2012-02-18T18:00:00.000-06:00> 














;; 我 出 生 时 布 里 斯 班 是 什么 时 间 ? 
(def australia-bday 
(t/to-time-zone bday (t/time-zone-for-id "Australia/Brisbane"))) 











australia-bday 
;; -> #<DateTime 2012-02-19T10:00:00.000+10:00> 


;; 但 它们 是 同一 时 刻 
(compare bday australia-bday) 
;; ->0 


讨论 

不 像 Java 内 建 的 类 ，clj-time 知道 时 区 。clj-time 包装 的 库 Joda-Time (http://joda-time. 
sourceforge.net/)， 包 含 了 国际 公认 的 tz 数据库 (http://www.twinsun.com/tz/tz-link.htm)。 
这 个 数据 库 记 录 了 地 球 上 几乎 每 个 地 点 的 ID 和 时 间 偏 移 。 

















tz 数据 库 也 记录 了 夏令 时 的 信息 。 例 如 ， 洛 杉 矶 在 冬天 是 UTC-08:00， 在 夏天 是 UTC- 
07:00。 这 在 使 用 clj-time 时 得 到 了 准确 的 反映 : 





(def la-tz (t/time-zone-for-id "America/Los_Angeles")) 


;; LA 在 冬天 是 UTC-08:00 
(t/from-time-zone (t/date-time 2012 01 01) la-tz) 
;; -> #<DateTime 2012-01-01T00:00:00.000-08:00> 





;; ..， 在 夏天 是 UTC-07:00 
(t/from-time-zone (t/date-time 2012 06 01) la-tz) 
;; -> #<DateTime 2012-06-01T00:00:00.000-07:00> 


clj-time.core/from-time-zone 国 数 接受 任何 DateTime， 并 将 它 的 时 区 改 为 期 望 的 时 区 。 








邮 





如 有 果 分 别 收 到 日 期 、 时 间 和 时 区 ， 和 希望 将 它们 合成 准确 的 DateTime， 就 可 以 用 它 。 





clj-time.core/to-time-zone 图 数 和 from-time-zone 的 参数 列表 一 样 ， 它 返回 的 DateTime 
就 是 同一 个 时 间 点 ， 但 是 采用 另 一 个 时 区 的 视角 。 要 将 不 同 来 源 的 时 间 和 日 期 信息 提供 给 
客户 ， 并 按照 客户 喜欢 的 时 区 ， 就 可 以 用 它 。 











有 时 候 你 可 能 只 想 处 理 机 器 本 地 时 间 。cUj-time.tLocat 命名 空间 提供 了 一 些 函 数 ， 包 括 
local-now， 用 来 取得 本 地 时 区 的 时 间 ， 也 包括 to-local-date-time， 将 时 间 的 视角 转换 成 
本 地 时 区 。 


参阅 
。 1.30 节 “ 计 算 时 间 间 隔 的 长 度 "， 以 及 1.33 节 “ 根 据 日 期 间 的 关系 取得 日 期 ”。 


1.35 将 Unix 时 间 惟 转换 成 Date 对 象 


作者 : Steven Proctor 


问题 

需要 从 Unix 时 间 惟 得 到 一 个 Date 对 象 。 

解决 方案 

在 处 理 来 自 外 部 系统 的 数据 时 ， 你 会 发 现 许 多 系统 以 Unix 时 间 格 式 来 表示 时 间 惟 。 在 处 


理 某 些 数据 库 时 ， 从 日 志文 件 的 时 间 改 中 解析 数据 时 ， 或 与 其 他 一 些 系 统 打 交道 ， 它 们 需 
要 处 理 跨 不 同时 区 和 文化 的 日 期 与 时 间 ， 你 可 能 会 遇 到 这 种 情况 。 


幸运 的 是 ， 利 用 Clojure 与 Java 的 良好 互 操作 能 力 ， 有 容易 的 解决 方案 : 
































(defn from-unix-time 
"Return a Java Date object from a Unix time representation expressed 
in whole seconds." 
[unix-time] 
(java.util.Date. unix-time)) 





下 面 是 如 何 使 用 from-unix-time 函数 : 











(from-unix-time 1366127520000) 
;; -> #inst "2013-04-16T15:52:00.000-00:00" 


讨论 


要 从 Unix 时 间 对 象 得 到 一 个 Java 的 Date 对 象 ， 只 要 利用 Clojure 的 Java 互 操作 功能 ， 
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构造 一 个 新 的 java.util.Date 对 象 (http://docs.oracle.com/javase/7/docs/api/java/util/Date. 
html) 。 





如 果 已 经 使 用 clj-time 库 (https://github.com/clj-time/clj-time) 或 想 用 它 ， 就 可 以 用 clj- 
time， 从 Unix 时 间 惟 得 到 一 个 DateTime 对 象 ; 
(require '[clj-time.coerce :as timec]) 
(defn datetime-from-unix-time 
"Return a DateTime object from a Unix time representation expressed 
in whole seconds." 


[unix-time] 
(timec/from-long unix-time)) 


应 用 datetime-from-unix-time 图 数 ， 就 会 发 现 得 到 了 一 个 DateTime， 包 含 了 正确 的 时 间 : 


(datetime-from-unix-time 1366127520000) 
;; -> #<DateTime 2013-04-16T15:52:00.000Z> 


平时 也 许 不 需要 担心 日 期 和 时 间 表 示 成 秒 的 形式 ， 但 如 果 需 要 ， 知 道 时 间 戳 很 容易 转 成 日 
期 格式 ， 用 于 系统 的 其 他 部 分 ， 不 是 很 好 吗 ? 


参阅 
。 1.25 节 “ 得 到 当前 的 日 期 和 时 间 ”。 
。 1.36 市 “将 Date 对 象 转换 成 Unix 时 间 惟 ”。 


1.36 ”将 Date 对 象 转换 成 Unix 时 间 戳 


作者 : Steven Proctor 








问题 
需要 从 一 个 Date 对 象 得 到 Unix 时 间 惟 的 表示 形式 。 
解决 方案 


许多 系统 以 Unix 时 间 的 格式 来 表示 时 间 改 ， 如 果 你 必须 与 这 些 系统 打交道 ， 就 必须 以 它 
们 期 望 的 格式 给 出 日 期 和 时 间 信 息 。 


亚运 的 是 ， 利 用 Clojure 与 Java 的 良好 互 操作 能 力 ， 有 容易 的 解决 方案 : 








(defn to-unix-time 
"Returns a Unix time representation expressed in whole seconds 
given a java.util.Date." 
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[date] 
(.getTime date)) 





下 面 是 如 何 使 用 to-unix-time 函数 : 











(def date (read-string "#inst \"2013-04-16T15:52:00.000-00:00\"")) 
;; -> #'User/date 


(to-unix-time date) 
;; -> 1366127520000 


讨论 
如 果 有 一 个 java.util.Date (http://docs.oracle.com/javase/7/docs/api/java/util/Date.html) 对 
象 ， 那 么 利用 Clojure 提供 的 Java 互 操作 性 ， 很 容易 将 时 间 表 示 为 Unix 时 间 。Java 的 
Date 对 象 有 一 个 方法 ， 名 为 getTime， 返 回 Unix 格式 的 时 间 。 





如 果 已 用 或 想 用 clj-time 库 (https:/github.com/cjj-time/cjj-time) ， 就 可 以 利用 clj-time 从 
DateTime 对 象 得 到 Unix 时 间 格 式 的 时 间 : 





(require '[clj-time.coerce :as timec]) 


(defn datetime-to-unix-time 
"Returns a Unix time representation expressed in whole seconds 
given a DateTime." 
[datetime] 
(timec/to-long datetime)) 


应 用 datetime-to-unix-time 国 数 ， 会 发 现 从 DateTime 对 象 得 到 了 一 个 Unix 时 间 : 


(def datetime (clj-time.core/date-time 2013 04 16 15 52)) 
;; #'User/datetime 


(datetime-to-unix-time datetime) 
;; 1366127520000 


有 了 clj-time.coerce， 只 要 使 用 to-long 国 数 就 可 以 将 Joda-Time 的 DateTime 对 象 转换 成 
Unix 时 间 格 式 。 


或 许 你 的 系统 永远 不 会 与 那些 需要 Unix 时 间 惟 的 系统 打交道 ， 但 如 果 设 计 的 系统 有 这 种 
需要 ，Clojure 能 够 容易 地 将 Date 或 DateTime 表示 成 Unix 时 间 格 式 。 

参阅 

。 1.25 节 “ 得 到 当前 的 日 期 和 时 间 ”。 

。 1.35 节 “ 将 Unix 时 间 改 转换 成 Date 对 象 ”。 
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2.0 简介 


既然 我 们 已 经 掌握 了 原生 类 型 ， 就 可 以 用 它们 做 点 事情 了 。 单 个 原子 值 很 好 ， 但 如 果 将 它 
们 聚 在 一 起 ， 事 情 就 会 变 得 更 加 有 趣 。 你 很 快 会 看 到 ， 数 据 操作 是 Clojure 的 一 个 强项 。 




















是 什么 让 Clojure 如 此 擅长 操作 集合? 原因 有 三 点 : 不 变性 、 持 久 性 和 序列 抽象 。Clojure 
内 建 的 每 个 集合 类 型 都 有 这 些 特性 ， 因 此 在 API 外 观 和 行为 上 是 一 致 的 。 


正如 伟大 的 Alan J. Perlis (早期 计算 机 科学 先驱 ) 所 说 的 : 











一 种 数据 结构 上 有 100 个 函数 操作 ， 胜 过 10 种 数据 结构 上 有 10 个 函数 操作 。 





本 章 介绍 了 Clojure 的 集合 ， 以 及 在 什么 情况 下 如 何 使 用 它们 。 最 后 ， 我 们 利用 Clojure 的 
接口 多 态 能 力 ， 通 过 构建 一 个 外 观 和 行为 与 其 他 Clojure 集合 类 似 的 特征 完备 的 类 型 ， 来 
总 结 这 一 章 的 内 容 。 























不 变性 

不 变性 意味 着 Clojure 的 数据 结构 一 旦 创建 ， 就 永远 不 能 改变 。 要 “修改 ”一 个 不 能 改变 
的 数据 结构 ， 只 能 复制 老 数据 结构 ， 并 在 相应 位 置 作出 期 望 的 修改 ， 从 而 创建 一 个 新 的 数 
据 结 构 。 


不 变性 也 意味 着 ，Clojure 的 数据 结构 不 论 嵌 套 多 深 ， 都 是 简单 的 值 ， 就 像 数 字 3 或 字符 \z。 
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说 “改变 ”3 的 值 是 疫 什么 意义 的 ， 因 为 它 就 是 3。 如果“ 改变 ”是 指 增加 它 ， 也 不 会 去 改 
变 3 本 身 。 相 反 ， 会 得 到 完全 不 同 的 新 值 ， 即 4。Clojure 将 这 个 值 的 概念 推广 到 所 有 的 数 
据 结构 。 对 Clojure 来 说 ， 其 他 语言 中 更 新 数据 结构 的 操作 ， 都 会 返回 一 个 全 新 的 数据 结 
构 。 你 可 以 继续 充满 自信 地 同时 传递 并 使 用 老 的 版 本 和 新 的 版 本 ， 因 为 你 知道 自己 所 做 的 
任何 事情 都 不 会 导致 程序 在 别 的 地 方 发 生意 想不到 的 变化 。 


这 个 特性 在 并 发 和 并 行 编程 中 非常 重要 ， 因 为 意外 的 变化 是 一 大 类 缺陷 的 来 源 。 有 了 不 变 
的 数据 ， 不 论 多 少 线程 都 可 以 读 取 同 一 数据 ， 不 用 担心 锁 或 竞争 条 件 ， 因 为 读 取 不 能 改变 
的 东西 总 是 安全 的 。 复制 ”操作 不 仅 没 有 成 本 ， 也 没有 必要 。 


持久 性 

你 可 能 会 癌 , “不 变性 ”会 有 效率 吗 ? 每 当 要 加 点 东西 的 时 候 都 要 复制 对 象 ， 这 一 定 不 切 
实际 ， 不 是 吗 ? 

是 的 ， 也 许 会 这 样 ， 但 持久 性 避免 了 这 一 点 。 持 久 性 意味 着 Clojure 的 数据 结构 尽管 在 逻 
辑 上 是 不 变 的 ， 但 仍 能 共享 其 内 部 结构 的 一 些 部 分 ， 以 实现 时 间 和 空间 上 的 效率 。 基 本 
上 ,更 新 不 变数 据 的 版 本 只 需要 更 新 相对 以 前 版 本 的 变化 ， 而 不 是 完整 的 深 复制 。 


当然 ， 为 了 保证 性 能 ， 这 种 机 制 使 用 了 一 些 极其 巧妙 的 算法 。 它 们 的 工作 原理 请 参考 Chris 
Okasaki 的 著作 Purely Functional Data Structures (Cambridge University Press)。 






































序列 抽象 
从 向 量 、 映 射 、 集 、 列 表 到 字符 串 和 流 ， 每 个 Clojure 集合 的 行为 都 是 类 似 的 、 可 预测 的 。 
它们 都 是 划时代 的 简单 高 效 的 工具 。 这 靠 的 是 Clojure 的 序列 抽象 。 


Clojure 中 的 集合 操作 函数 家 族 ， 其 实现 都 基于 一 个 简单 抽象 :每 个 集合 都 可 以 看 成 值 的 序 
列 。 通 过 实现 first、rest 和 cons， 所 有 数据 结构 (其 至 你 自己 建立 的 ) 都 可 以 分 享 ISeq 
接口 。 

然后 ， 就 可 以 使 用 Clojure 中 大 量 的 序列 操作 函数 以 及 所 有 的 数据 结构 了 。 所 有 函数 式 编 
程 最 让 人 喜爱 的 函数 (nap、reduce、fitter 等 )， 都 可 以 互 换 应 用 在 所 有 数据 结构 上 。 从 
本 质 上 说 ， 序 列 抽象 既 提 供 了 传统 基于 列表 的 LISP 编程 的 全 部 表达 能 力 ， 又 不 强迫 你 真 
正 去 用 列表 。 相 反 ， 你 可 以 用 对 任务 最 有 效 的 类 型 ， 而 且 只 要 你 觉得 有 必要 ， 就 可 以 用 同 
样 的 方式 使 用 它们 。 


2.1 创建 列表 


作者 : Luke VanderHart 


























问题 
需要 在 源 代码 中 创建 一 个 列表 数据 结构 。 


解决 方案 


要 明确 地 创建 一 个 列表 (clojure.lang.PersistentList)， 有 两 种 基本 方法 。 








可 以 用 单 引号 加 上 括号 ， 表明 这 个 列表 应 该 被 当成 一 个 数据 结构 ， 不 要 马上 求 值 : 


"Ct 2 130) 
;; -> (1 :2 "3") 





或 者 ， 更 常见 的 是 ， 可 以 使 用 List 函数 ， 它 接受 可 变数 目的 参数 ， 用 它们 创建 一 个 列表 : 


(list 1 :2 "3") 
;; -> (1 :2 "3") 


讨论 
通常 ， 在 这 两 种 方法 中 ， 使 用 List 函数 是 更 好 的 选择 。 用 单 引 号 列表 的 问题 在 于 ， 它 阻止 
了 列表 中 所 有 表达 式 的 求 值 ， 这 意味 着 这 些 符 号 会 被 当 作 字面 符号 返回 ， 而 不 是 解析 变量 
或 调用 函数 。 但 List 会 以 正常 的 方式 对 参数 求 值 ， 然 后 再 创建 列表 。 对 于 不 是 宏 的 代码 ， 
这 通常 是 期 望 的 方式 : 




















(def x 2) 


'(1 x) 
;; -> (1 x) 


(list 1 x) 
(1 2) 


这 就 是 说 ，'() 是 创建 空 列表 的 习惯 方式 ， 它 更 简明 。 由 于 它 是 空 的 ， 也 不 用 考虑 内 容 求 值 。 





列表 与 向 量 
Clojure 既 有 列表 (list)， 也 有 向 量 (vector)。 两 者 都 是 序列 数据 结构 。 但 对 大 多 数 情 
况 ， 向 量 更 适合 ， 在 Clojure 的 习惯 中 更 常用 。 
这 有 一 些 原因 。 向 量 的 字面 语法 比 列表 更 清楚 ， 空 间 效 率 和 性 能 是 一 样 的 。 而 且 ， 向 
量 利 用 索引 ， 支 持 接 近 常 数 的 查找 时 间 (O(logyn))， 而 列表 则 不 同 ， 需 要 线性 地 查找 
时 间 (O(n)。 
一 般 来 说 ， 明 确 地 选择 列表 而 非 向 量 只 有 一 个 原因 ， 就 是 需要 数据 结构 支持 高 效 的 前 
问 质 入， 列表 能 做 到 这 一 点 ， 而 向 量 在 尾 庙 添加 元 素 是 最 高 效 的 。 
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sh 


阅 
。 2.2 节 “ 从 已 有 的 数据 结构 创建 列表 ”。 
。 2.6 节 “创建 向 量 ”。 


2.2 ”从 已 有 的 数据 结构 创建 列表 


作者 : Luke VanderHart 





问题 
已 有 一 个 序列 数据 结构 ， 需 要 将 它 转换 成 列表 ， 作 为 具体 的 数据 类 型 。 
解决 方案 


最 容易 的 解决 方案 是 : 不 要 这 么 做 。 拥 有 具体 的 列表 并 不 能 提供 多 少 好 处 ， 不 如 直接 使 用 
已 有 数据 结构 的 序列 抽象 ， 而 且 对 于 大 型 数据 结构 ， 转 换代 价 可 能 很 高 。 


如 果 确 实 需要 显 式 地 转换 具体 的 数据 结构 ， 那 么 有 两 种 方法 。 
首先 ， 可 以 使 用 appty 函数 来 调用 list 函数 ， 将 已 有 的 数据 结构 作为 它 的 参数 : 


(apply list [1 2 3 4 5]) 
;; -> (1234 5) 


或 者 ， 可 以 使 用 into 函数 ， 反 复 连接 取 自 原 有 数据 结构 的 元 素 ， 得 到 列表 。 但 要 注意 ， 这 
种 方法 的 副作用 是 颠倒 原来 集合 的 顺序 : 





(into '() [12345]) 
;; -> (5432 1) 


讨论 
这 两 种 方法 都 可 行 。 但 其 工作 原理 差异 非常 大 。 


在 使 用 apply 时 ， 实 际 上 是 调用 List 函数 ， 而 它 的 许多 参数 是 放 在 原来 的 数据 结构 中 。 这 
昕 起 来 可 能 有 点 奇怪 ， 如 果 原 来 的 数据 结构 包含 上 百 万 个 元 素 ， 就 更 奇怪 了 。 用 上 百 万 个 
参数 调用 一 个 函数 是 意味 着 什么 ”鉴于 JVM 限制 了 方法 不 能 超过 255 个 参数 (参见 JVM 
类 文件 规格 说 明 (http://docs.oracle.com/javase/specs/jvms/se7/html/jvms-4.html#jvms-4.3.3))， 
这 怎么 可 行 呢 ? 


实际 上 ， 带 有 可 变 参 数 的 国 数 〈 例 如 tist)， 其 处 理 方式 有 些 特殊 ， 参数 列表 是 作为 一 个 
序列 传 入 的 。apply 知道 这 一 点 ， 将 原来 数据 结构 的 序列 视图 直接 传 给 了 接受 参数 的 函数 。 
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这 就 是 可 行 的 原因 ， 实 际 上 没有 一 个 JVM 方法 调用 了 上 百 万 个 参数 。 


into 的 工作 原理 完全 不 同 : 它 接 受 两 个 参数 ， 第 一 个 是 一 个 数据 结构 ， 第 二 个 是 一 个 序 
列 。 它 利用 conj 函数 (将 在 别处 详细 讨论 )， 反 复 地 将 序列 中 的 元 素 结合 到 数据 结构 中 。 
这 就 是 序列 颠倒 的 原因 。 元 素 是 从 序列 的 前 端 取出 的 ， 但 列表 的 conj 操作 将 它 放 在 已 有 元 
素 的 前 面 。 因 此 ， 输 入 序列 的 第 一 个 元 素 将 成 为 列表 的 最 后 一 个 元 素 ， 以 此 类 推 。 


既然 次 序 会 颠倒 ， 为 什么 要 选择 into， 而 不 是 apply ?. 答案 是 “速度 ”。into 利用 了 
Clojure 的 瞬 态 数据 结构 (transient) ， 它 大 幅 提升 了 性 能 。 在 作者 的 机 器 上 ， 利 用 apply 将 
百 万 元 素 的 向 量 转换 成 列表 ， 平 均 耗 时 750 训 秒 ， 而 使 用 into 只 花 了 不 到 一 半 的 时 间 ， 平 
均 耗 时 350 毫秒 。 当 然 ， 列 表 的 次 序 反 过 来 了 ， 不 论 将 输入 的 次 序 还 是 输出 的 次 序 反 过 
来 ， 都 会 抵消 速度 的 优势 。 最 后 ， 只 有 在 颠倒 的 次 序 可 以 接受 时 ，into 才 有 优势 。 






































参阅 
。 2.1 节 “ 创 建 列表 ”。 


2.3 在 列表 中 “添加 ”一 个 元 素 


作者 : Luke VanderHart 


问题 
需要 在 列表 中 添加 一 个 元 素 ， 或 者 用 国 数 式 的 术语 来 说 ， 需 要 从 已 有 的 列表 导出 一 个 新 列 
表 ， 包 含 一 个 添加 的 元 素 。 


解决 方案 
使 用 conj 函数 。conj 用 于 向 逻辑 集合 添加 一 个 或 多 个 元 素 ， 它 是 多 态 的 ， 这 意味 着 它 适 
用 于 多 个 具体 的 数据 类 型 ， 包 括 列表 








(conj (list 1 2 3) 4) 
;; -> (4 1 2 3) 


也 可 以 一 次 添加 多 个 元 素 : 


(conj (list 1 2 3) 4 5) 
;; -> (5412 3) 


讨论 
conj 的 行为 可 能 因 具 体 的 类 型 而 稍 有 不 同 。 它 总 是 向 不 可 变 的 集合 “添加 ”一 个 元 素 ， 然 
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后 返回 一 个 包含 那个 元 素 的 新 集合 。 但 它 可 能 将 新 元 素 添 加 在 集合 的 不 同位 置 ， 这 取决 于 
在 具体 的 类 型 中 怎样 做 最 高 效 。 


如 果 是 列表 ，conj 将 在 列表 头 上 添加 元 素 ， 因 为 链接 列表 数据 结构 仅 在 头 上 支持 常量 时 间 
的 插入 。 











=» 











conj 与 cons 


熟 六 Common Lisp 或 Scheme 的 人 ， 可 能 希望 看 到 用 cons 函数 ， 而 不 是 conj。Clojure 
确实 有 cons 函数 ， 但 它 的 目的 有 一 点 不 同 。 

conj 将 返回 一 个 新 的 具体 类 对 象 clojure.lang.PersistentList (在 用 于 列表 时 )， 而 
cons 总 是 返回 一 个 新 的 序列 ， 元 素 加 在 第 一 个 位 置 ， 后 面 是 原来 的 集合 。 

区 别 很 细微 ， 尤其 是 从 算法 上 来 看 ，ctLojure.Lang.PersistentList 和 cons 构造 的 序列 
部 是 持久 的 链接 列表 类 型 。 

简 而 言 之 ，conj 是 具体 的 数据 结构 操作 ， 它 不 会 改变 处 理 的 数据 结构 的 具体 类 型 ， 
而 cons 是 序列 操作 ， 只 保证 它 将 返回 一 个 序列 : 实际 上 ， 它 返回 一 个 cons 单元 
(clojure.lang.Cons)， 实 现 了 序列 接口 ， 不 论 给 它 的 是 什么 类 型 的 序列 集合 。 

与 conj 不 同 ，cons 也 保证 在 返回 的 序列 中 ， 新 增 的 元 素 放 在 头 上 ， 不 论 集 合 的 类 型 是 
什么 。 











参阅 
。 2.7 节 “在 向 量 中 “添加 ”一 个 元 素 ”。 


2.4 从 列表 中 “ 移 除 ” 一 个 元 素 


作者 : Luke VanderHart 


问题 
需要 从 列表 中 移 除 一 个 元 素 ， 得 到 不 包含 该 元 素 的 列表 。 


解决 方案 


从 列表 中 删除 第 一 个 元 素 很 容易 ， 可 以 使 用 国 数 rest 或 pop。 在 用 于 非 空 列表 时 ， 它 们 的 
效果 相同 : 

















(pop '(1 2 3)) 
;; -> (2 3) 
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(rest '(1 2 3)) 
区 (2 3) 


讨论 
rest 实际 上 是 一 个 序列 函数 ， 用 于 得 到 序列 的 尾 。 由 于 Clojure 的 列表 直接 实现 了 序列 接 
口 ， 对 列表 使 用 rest 总 会 返回 另 一 个 列表 (可 能 是 空 的 )。 








pop 与 conj 类 似 ， 它 操作 具体 的 数据 结构 ， 而 不 是 序列 接口 。 像 conj 一 样 ， 它 是 多 态 的 ， 
移 除 元 素 的 位 置 取决 于 什么 对 于 这 种 具体 类 型 最 有 效 。 


在 用 于 空 列表 时 ， 这 两 个 函数 的 反应 是 不 同 的 。pop 会 抛 出 异常 ， 而 rest 会 返回 空 列表 : 





(pop '()) 
;; -> IllegalStateException Can't pop empty list ... 


(rest '()) 

;; -> () 
除了 第 一 个 位 置 ， 列 表 不 支持 从 其 他 位 置 移 除 元 素 。 如 果 需 要 从 列表 中 间或 末尾 移 除 一 个 
元 素 ， 就 需要 使 用 序列 操作 函数 ， 然 后 将 结果 转 回 具 体 的 列表 (如果 因为 某 些 原因 绝对 需 
要 一 个 列表 )。 






































参阅 
。 2.8 市 “从 向 量 中 “ 移 除 ”一 个 元 素 ”。 


2.5 测试 是 否 列 表 


作者 : Steve Miner 


问题 
需要 测试 一 个 值 是 不 是 一 个 列表 。 
解决 方案 


List? 国 数 似乎 是 明显 的 选择 ， 但 在 大 多 数 情况 下 ， 最 好 是 使 用 更 常用 的 seq? 函数 来 测试 。 





讨论 
list? 专门 测试 参数 是 否 实现 了 clojure.lang.IPersistentList 接口 ， 但 在 大 多 数 情况 下 ， 
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实际 上 是 想 知道 这 个 值 是 否 是 一 个 序列 〈 实 现 clojure.lang.ISeq 接口 )， 











见 的 抽象 。 


并 非 所 有 打印 出 来 的 像 列表 〈 在 括号 中 ) 的 东西 都 能 通过 tist? 测试 。 








它 是 比 列表 更 常 


在 实践 中 ， 


常常 在 


操作 列表 时 得 到 Cons 和 LazySeq 值 。 你 只 要 专注 于 基本 的 序列 抽象 ， 就 不 必 担 心 这 些 具 体 


实现 的 细 市 : 





;; 通过 List 构建 的 列表 同时 通过 List? 和 seq? 测试 


(list? (list 1 2 3)) 
;; -> true 
(seq? (list 1 2 3)) 
;; -> true 


;; cons 虽然 看 起 来 像 列 表 ， 但 实际 上 是 Cons 实例 





(list? (cons 1 '(2 3))) 
;; -> false 

(type (cons 1 '(2 3))) 
;; -> clojure.lang.Cons 
(seq? (cons 1 '(2 3))) 
;; -> true 





;; range 的 惰性 返回 值 是 序列 ， 但 不 是 列表 











(list? (range 3)) 

;; -> false 

(seq? (range 3)) 

;; -> true 

(type (range 3)) 

;; -> clojure.lang.LazySeq 


用 seq? 几乎 总 是 比 用 tist? 好 。 
参阅 


。 2.1 节 “ 创 建 列 表 ”。 
。 2.3 市 “在 列表 中 “添加 ”一 个 元 素 ”。 


。 2.26 市 “检测 集合 是 否 包含 几 个 值 中 的 一 个 ”。 


2.6 创建 向 量 


作者 : Luke VanderHart 


问题 





需要 创建 一 个 向 量 数据 结构 ， 要 么 作为 字 男 














i 值 ， 要 么 来 自 原 有 的 数据 结构 。 
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解决 方案 
到 目前 为 止 ， 创 建 向 量 最 容易 的 方式 ， 就 是 使 用 字面 
以 使 用 vector 函数 ， 它 将 参数 创建 为 一 个 向 量 ， 
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[1 :2 "3"] 
[2 "3"] 


(vector 1 :2 "3") 
sD [1 2 "3"] 





要 通过 已 有 的 数据 结构 来 构建 ， 可 以 使 用 vec 函数 ， 它 接受 任何 集合 ， 返 回 包 含 同 样 元 素 
的 向 量 : 











或 者 ， 可 以 使 用 into 函数 ， 它 接受 两 个 集合 ， 用 来 自 第 二 个 集合 的 元 素 ， 对 第 一 个 集合 反 
复 调用 conj: 





(into [] '(1 :2 "3")) 
;; -> [1 :2 "3"] 


讨论 
很 少 有 使 用 vector 函数 而 不 是 字面 值 向 量 的 情况 。 在 Clojure 中 ， 疝 量 不 像 列 表 ， 不 会 作 
为 函数 调用 (或 任何 其 他 东西 ) 来 求 值 ， 所 以 不 像 列 表 字面 值 那样 要 考虑 引号 的 问题 。 


奇怪 的 是 ， 在 利用 已 有 的 集合 构建 向 量 时 ， 使 用 into 要 比 使 用 vec 快 30%， 原 因 是 用 了 
瞬 态 数据 结构 来 提速 。 如 果 需 要 转换 大 的 集合 ， 并 且 在 意 速度 ， 就 考虑 使 用 into， 否 则 ， 
vec 通常 可 读 性 更 好 。 









































参阅 
。 2.1 节 “ 创 建 列表 ”。 
。 2.2 节 “ 从 已 有 的 数据 结构 创建 列表 ”。 


2.7 ”在 向 量 中 “添加 ”一 个 元 素 


作者 : Luke VanderHart 








问题 
需要 在 向 量 中 添加 一 个 元 素 ， 得 到 包含 该 元 素 的 新 向 量 。 
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解决 方案 


conj 函数 在 用 于 向 量 时 ， 返 回 一 个 向 量 ， 末 尾 附 加 一 个 或 多 个 元 素 : 








(conj [1 2 3] 4) 
;; -> [1 2 3 4] 


(conj [1 2 3] 4 5) 
;; -> [12345] 


讨论 
除了 末尾 ， 向 量 不 文 持 在 其 他 任何 地 方 添加 新 的 元 素 。 如 果 需 要 在 中 间 插 入 一 个 元 素 ， 就 
需要 使 用 序列 操作 函数 ， 并 在 完成 后 将 它 转 回 成 向 量 (如 果 有 必要 )。 


由 于 向 量 是 关联 的 整数 索引 映射 到 值 )， 也 可 以 使 用 assoc 函数 ， 令 索引 等 于 向 量 当前 的 
长 度 (最 大 索引 加 1)， 来 添加 元 素 : 























(assoc [:a :b :c] 3 :x) 
;; -> [:a :b :c :x] 





但 是 ， 这 种 方法 比 conj 更 容易 出 错 。 如 果 提 供 的 索引 太 小 ， 就 可 能 “ 禾 写 ”向 量 中 前 面 的 
值 ， 如 果 索 引 大 于 向 量 当 前 的 长 度 ， 就 会 抛 出 Index0ut0fBoundsException。 





























不 过 ， 这 个 方法 仍 有 用 武之 地 。 如 果 代 码 已 经 对 向 量 使 用 了 assoc， 可 以 用 这 个 技巧 来 更 
新 值 ， 得 到 新 的 向 量 。 

参阅 

。 2.3 节 “ 在 列表 中 “添加 ”一 个 元 素 ”。 

。 2.6 节 “创建 向 量 ”。 


2.8 从 向 量 中 “ 移 除 ” 一 个 元 素 


作者 : Luke VanderHart 





























问题 

需要 从 向 量 中 移 除 一 个 元 素 ， 得 到 不 包含 该 元 素 的 新 向 量 。 

解决 方案 

要 有 效 地 从 向 量 末 尾 移 除 元 素 ， 请 使 用 pop 函数 ， 它 接受 一 个 向 量 ， 返 回 没 有 末尾 元 素 的 
新 向 量 。 





复合 数据 | 67 


(pop [1 2 3 4]) 
;; -> [1 2 3] 


讨论 

尽管 没有 像 pop 移 除 末 尾 元 素 那样 ， 专 门 从 向 量 头 上 移 除 元 素 的 操作 ， 但 有 一 个 国 数 
subvec， 可 以 有 效 地 移 除 向 量 头 部 或 尾部 的 任意 个 元 素 。 给 定 一 个 向 量 ， 一 个 起 始 索引 ， 
一 个 〈 可 选 的 ) 终止 索引 ， 它 将 返回 从 起 始 (包含 ) 到 终止 (不 包含 ) 索引 的 向 量 。 











下 面 的 例子 丢弃 了 向 量 头 上 的 一 个 元 素 。 可 以 像 这 样 用 subvec: 














(subvec [:a :b :c :d] 1) 
;; -> [:b :c :d] 


或 者 ， 移 除 向 量 头 上 和 末尾 的 元 素 ， 将 终止 索引 传递 给 subvec: 


(subvec [:a :b :c :d] 1 3) 
| 





因为 subvec 利用 了 向 量 的 内 部 表示 ， 创 建 的 子 向 量 与 原来 的 内 部 结构 一 样 ， 它 非常 有 效 ， 
执行 时 间 是 常数 。 它 是 从 向 量 头 上 移 除 元 素 的 唯一 有 效 方法 。 
虽然 可 以 在 向 量 上 使 用 rest 或 drop 等 函数 ， 但 它们 在 技术 上 是 序列 操作 ， 不 是 向 量 操作 。 


它们 返回 的 值 只 能 保证 是 序列 ， 而 不 是 具体 的 向 量 ， 因 此 也 不 能 保证 其 具有 向 量 的 特点 或 
性 能 。 





























当然 ， 可 以 利用 vec 或 into []， 将 序列 转换 回 具体 的 向 量 ， 但 这 对 于 大 向 量 是 代价 高 兄 
的 操作 。 








Zl 


参阅 
。 2.4 市 “从 列表 中 “ 移 除 ”一 个 元 素 ”。 
。 2.6 节 “ 创 建 向 量 ”。 


2.9 取得 索引 处 的 值 


作者 : Luke VanderHart 


问题 
有 一 个 向 量 ， 需 要 取得 特定 位 置 (索引 ) 的 值 。 





解决 方案 
有 几 种 实现 方法 。 
使 用 nth 











nth 国 数 可 用 于 所 有 序列 ， 在 向 量 这 样 的 索引 集合 上 使 用 时 进行 了 特殊 处 理 ， 能 够 提供 常 








数 访问 时 间 : 


(nth [:a :b :c :d] 2) 


;; -> :C 

















如 果 给 出 的 索引 值 超过 向 量 的 长 度 ，nth 将 抛 出 异常 ， 除 非 提 供 可 选 的 第 3 个 参数 ， 














在 索引 越界 时 返回 : 








(nth [:a :b :c] 4) 
;; -> Index0utOfBoundsException 


(nth [:a :b :c] 4 :not-found) 
;; -> :not-found 


将 向 量 作 为 其 索引 的 函数 
向 量 本 身 也 是 函数 ， 在 用 整数 参数 调用 时 ， 将 返回 该 索引 处 的 值 : 








(def v [:a :b :c]) 
(v 2) 
Es eG 


使 用 越界 的 索引 来 调用 向 量 函 数 ， 将 导致 Index0ut0fBoundsException。 
使 用 get 











它 会 


因为 向 量 支 持 Associative 接口 ， 以 整数 索引 为 键 ， 所 以 可 以 用 get 函数 来 取得 索引 处 


的 值 : 


(get [:a :b :c] 2) 


De 











不 像 nth， 如 果 向 get 提供 越界 的 索引 ， 它 将 返回 nil， 而 不 是 抛 出 异常 ， 除 非 提 供 默 认 





值 ， 在 键 (这 里 就 是 索引 ) 未 找到 时 返回 它 : 





(get [:a :b :c] 5) 
;; -> :nil 


(get [:a :b :c] 5 :not-found) 
; -> :not-found 
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讨论 





应 该 使 用 哪 种 技术 ? 这 些 方 法 都 很 好 ， 你 的 选择 取决 于 你 如 何 看 待 向 量 。nth 专注 于 它 的 
序列 本 质 ， 而 get 强调 了 它 是 索引 的 、 关 联 的 。 将 向 量 作为 一 个 国 数 也 没 错 ，Clojure 中 所 





有 关联 集合 都 是 其 键 的 函数 。 
最 后 ， 在 作出 这 种 选择 时 ， 应 该 考虑 以 下 问题 。 
。 哪 种 方法 让 代码 更 明白 易 懂 ? 




















。 你 要 处 理 的 数据 的 本 质 是 什么 ?例如 ， 它 是 否 看 起 来 是 个 向 量 ， 而 本 质 是 一 个 序列 (使 





用 nth) ? 或 者 本 质 是 与 索引 关联 的 值 (使 用 get) ? 

















。 备 选 技术 的 失效 模式 是 什么 ? 例如， 返回 nil 或 抛 出 异常 是 期 望 的 结果 吗 ? 





参阅 
。 2.16 节 “ 从 映射 表 中 取得 值 ”。 


2.10 ”设置 索引 处 的 值 


作者 : Luke VanderHart 














问题 
对 于 给 定 的 向 量 ， 需 要 得 到 一 个 新 向 量 ， 在 特定 索引 处 具有 不 同 的 值 。 
解决 方案 


使 用 assoc 来 设置 特定 索引 处 的 值 。 


(assoc [:a :b :c ] 1 :x) 
;; -> [:a :x :c] 


assoc 也 可 以 同时 设置 多 个 索引 处 的 值 ， 只 要 提供 额外 的 索引 / 值 对 。 


(assoc [:a :b :c ] 1 :x 2 :y) 
;; -> [:a :x :y] 


讨论 











你 可 能 注意 到 ，assoc 函数 也 用 于 设置 映射 表 中 键 所 对 应 的 值 。 这 是 


内 








为 向 量 和 映射 表 一 


样 都 是 关联 的 ， 都 实现 了 同样 的 接口 (clojure.lang.Associative)， 这 是 assoc 在 背后 用 





到 的 东西 。 











但 与 映射 表 不 同 ， 在 assoc 用 于 向 量 时 ， 键 必须 是 整数 索引 ， 并 在 向量 的 范围 之 内 。 试 图 
使 用 非 整 数 的 键 ， 将 导致 ILlegalArgumentException， 试 图 使 用 超过 向 量 长 度 的 索引 ， 将 
导致 Index0ut0fBoundsException。 
































注意 ， 在 使 用 assoc 时 ， 索 引 可 以 等 于 当前 向 量 的 长 度 ( 比 最 大 的 索引 大 1)。 这 将 导致 元 
素 添 加 在 末尾 。 





参阅 
。 2.7 节 “在 向 量 中 “添加 ”一 个 元 素 ”。 
。 2.18 节 “ 设 置 映射 表 中 的 键 。” 


2.11 创建 集 


作者 : Luke VanderHart 








问题 
需要 创建 由 不 同 对 象 构成 的 、 未 排序 的 集合 ， 能 快速 地 检查 元 素 是 否 属于 该 集合 。 





解决 方案 
使 用 集 的 字面 值 来 创建 对 象 集 ， 














#{:a :b :c} 
;; -> #{:a :Cc :b} 


;; 集 的 字面 值 中 的 重复 元 素 是 错误 
#{:xX :y :z :z :2z} 
;; -> IllegalArgumentException Duplicate key: :y :z ... 











使 用 hash-set， 利 用 参数 创建 集 : 


(hash-set :a :b :c) 
;; -> #{:a :Cc :b} 


(apply hash-set :a [:b :c]) 
;; -> #{:a :Cc :b} 





使 用 set， 从 其 他 集合 创建 集 : 


(set "hello") 
;; -> #{\e \h \L \o} 


或 者 利用 into 和 一 个 集 来 创建 一 个 新 集 : 
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(into #{} [:a :b :c :a]) 
;; -> #{:a :b :c} 


(into #{:a :b} [:b :c :d]) 
;; -> #{:a :b :c :d} 


集 构建 的 性 能 


在 本 书 编写 时 ， 对 于 大 型 的 对 象 集合 ，into 方法 比 set 方法 要 快 3 倍 。 如 果 
要 处 理 大 型 集合 ， 又 比较 关注 性 能 ， 请 使 用 into: 











(def largeseq (doall (range 1e5))) 


(time (dotimes [_ 100] (set largeseq))) 
;; *Oout* 
;; "Elapsed time: 5594.961 msecs" 


(time (dotimes [_ 100] (into #{} largeseq))) 


;OU 
;; "Elapsed time: 1329.66 msecs" 


用 sorted-set 创建 一 个 排序 的 集 : 


(sorted-set 99 4 32 7) 
;; -> #{4 7 32 99} 


(into (sorted-set) "the quick brown fox jumps over the Lazy dog") 
;; -> #{\space \a \b \c \d \e \f \g \h Mt \j \k \L \m \n No \p 
;; \q \r \s \t \u \v Ww \x \y \z} 
讨论 
集 是 很 有 用 的 数据 结构 。 如 果 有 一 个 值 的 集合 ， 但 只 关心 其 中 不 同 的 值 ， 常 常会 用 到 集 
在 集中 查找 元 素 的 时 间 复 杂 度 通常 是 0(1)。 
前 面 展 示 的 技术 构建 的 都 是 散 列 集 ， 它 们 没有 排序 ， 使 用 散 列 表 作 为 内 部 表示 形式 。 


Clojure 也 支持 创建 排序 集 ， 它 维持 元 素 的 次 序 。 利 用 compare、sorted-set 创建 的 集 保持 
元 素 升 序 排列 。 这 在 将 集 作为 序列 时 是 有 用 的 : 

















(def alphabet (into (sorted-set) "qwertyuiopasdfghjklzxcvbnm")) 
(last alphabet) 

;; -> \z 

(second (disj alphabet \b)) 

;; -> \c 


排序 集中 的 所 有 元 素 必须 彼此 进行 比较 (也 就 是 说 ， 排 序 集 中 不 能 既 有 字符 
串 ， 又 有 数字 )。 如 果 添 加 不 可 比较 的 值 ， 将 导致 运行 时 错误 。 











在 排序 集中 添加 和 移 除 对 象 ， 总 是 会 得 到 另 一 个 排序 集 


如 果 希 望 存储 的 值 没有 自然 的 排序 次 序 (或 者 不 想 用 它们 的 自然 次 序 )， 可 以 用 sorted- 
set-by 来 指明 定制 的 比较 方法 。 在 添加 或 移 除 对 象 时 ， 创 建 集 时 使 用 的 比较 方法 将 仍然 
有 效 : 





























(def descending-set (sorted-set-by > 1 2 3)) 


(into descending-set [-1 4]) 

; -> #{4321 -1} 
选择 散 列 集 还 是 排序 集 ， 需 要 考虑 性 能 上 的 妥协 。 散 列 集 基 于 散 列表 ， 大 多 数 情况 下 插入 
和 查找 时 间 是 常数 。 但 是 ， 它 们 需要 一 定 程度 的 内 容 消费 。 排 序 集 基 于 平衡 的 红 黑 树 ， 内 
存 使 用 上 更 有 效率 ， 但 查找 和 插入 比较 慢 。 














参阅 
。 2.6 节 “ 创 建 向 量 ”。 
。 2.12 节 “ 在 集中 添加 和 移 除 元 素 ”。 


2.12 在 集中 添加 和 移 除 元 素 


作者 : Luke VanderHart 





问题 
要 添加 或 删除 一 些 元 素 ， 得 到 一 个 新 集 。 
解决 方案 











conj 函数 支持 集 ， 就 像 它 支持 列表 、 向 量 和 映射 表 一 样 。 用 它 在 集中 添加 元 素 ， 将 集 与 要 
添加 的 任意 多 个 元 素 传递 给 它 : 


(conj #{:a :b :c} :d) 
; -> #{:a :Cc :b :d} 


(conj #{:a :b :c} :d :e) 
; -> #{:a :Cc :b :d :el 





要 移 除 一 个 或 多 个 元 素 ， 请 使 用 disj 函数 ， 它 是 专门 针对 集 的 。 它 接受 一 个 集 ， 以 及 要 移 
除 的 一 个 或 多 个 键 : 


(disj #{:a :b :c} :b) 
;; -> #{:a :c} 
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(disj #{:a :b :c} :b :cy) 
;; -> #{:a} 


讨论 
由 于 集 是 未 排序 的 ， 就 没有 添加 或 移 除 的 元 素 在 “哪里 ”的 概念 。 集 要 么 包含 一 个 元 素 ， 
要 么 不 包含 。 


注意 ，conj 和 disj 返回 的 集 ， 与 原来 的 集 都 有 同样 的 具体 类 型 。 散 列 集 还 是 散 列 集 ， 排 
序 集 还 是 排序 集 。 


另外 值得 注意 的 是 ， 如 果 集中 已 包含 或 不 包含 要 添加 或 移 除 的 元 素 ， 这 些 操作 就 什么 也 不 
做 。 如 果 集 已 包含 该 元 素 ，conj 将 返回 同样 的 集 。 如 果 指 定 的 元 素 不 在 集中 ，dtsj 也 返回 
同样 的 集 。 


如 果 要 在 集中 添加 或 移 除 大 量 的 元 素 ， 就 应 该 考虑 使 用 clojure.set 命名 空间 中 专门 的 
集 操作 函数 ， 尤 其 是 clojure.set/union (用 于 将 多 个 集中 的 元 素 合并 ) 和 clojure.set/ 
difference (用 于 得 到 不 包含 在 另 一 个 集中 的 元 素 )。 与 多 次 调用 或 用 大 量 参数 来 调用 












































conj 和 disj 相 比 ， 它 们 表示 集 操作 通常 更 自然 。 
参阅 


。 2.3 节 “ 在 列表 中 “添加 ”一 个 元 素 ”。 
。 2.7 节 “ 在 向 量 中 “添加 ”一 个 元 素 ”。 
。 2.14 节 “ 使 用 集 操作 ”。 

2.13 测试 集成 员 


作者 : Luke VanderHart 





解决 方案 
检查 单个 元 素 最 容易 的 方法 是 contatns? 函数 ， 它 接受 一 个 集 和 一 个 元 素 ， 如 果 集 包含 访 
元 素 ， 就 返回 true: 





(contains? #{:red :white :green} :blue) 
;; -> false 
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(contains? #{:red :white :green} :green) 
;; -> true 


get 国 数 也 适用 于 集 ， 做 的 事情 基本 上 一 样 ， 但 它 不 返回 true 或 false。 如 果 是 成 员 ， 它 
就 返回 该 值 ， 不 是 就 返回 nil: 























(get #{:red :white :green} :blue) 
;; -> nil 


(get #{:red :white :green} :green) 
;; -> :green 


最 后 ， 集 也 是 国 数 。 用 一 个 参数 去 调用 时 ， 它 像 get 一 样 ， 如 果 是 成 员 就 返回 该 参数 ， 否 
则 返回 nil: 








(def my-set #{:red :white :green}) 


(my-set :blue) 
;; -> niL 


(my-set :green) 
;; -> :green 








还 要 注意 ， 关 键 字 对 集 的 行为 与 对 映射 表 的 行为 一 样 。 因 此 ， 下 面 与 使 用 get 是 等 价 的 : 














(:bLue #{:red :white :green}) 
;; -> nil 


(:green #{:red :white :green}) 
;; -> :green 


讨论 
选择 contains 还 是 get 主要 是 一 种 美学 考量 。 但 是 ， 如 果 在 集中 有 可 能 包含 nil 这 个 至 关 
重要 的 值 ， 就 肯定 要 用 contains?， 因 为 get 返回 nitL 时 ， 不 能 告诉 你 任何 信息 。 

















用 和 集 作 为 函数 很 有 趣 ， 而 且 如 果 用 它 作 为 序列 操作 的 谓词 函数 ， 还 非常 有 用 。 例 如 ， 常 常 
需要 过 滤 一 个 序列 ， 让 它 只 包含 集中 的 元 素 。 在 这 种 情况 下 ， 用 和 集 本 身 作为 函数 既 方 便 ， 
又 符合 习惯 : 
(take 10 
(filter #{1 2 3} 


(repeatedly #(rand-int 10)))) 
;; ->(2123221221) 





这 段 代码 先 利 用 repeatedly 反复 调用 rand-int (包装 成 一 个 匿名 函数 )， 创 建 了 一 个 无 限 
情 性 序列 ， 包 含 1 至 10 的 随机 数 。 然 后 让 这 个 序列 通过 一 个 过 滤器 ， 包 含 1 至 3 的 集 作 
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为 过 着 谓 词 。 结 果 是 另 一 个 无 限 惰 性 序列 ， 但 只 包含 谓词 集中 的 成 员 。 


文 个 例子 是 编造 的 。 但 是 ， 集 作为 谓词 函数 是 非常 有 用 的 技巧 ， 经 常 出 现在 Clojure 项 
目 中 。 





参阅 
。 2.14 节 “ 使 用 集 操作 ”。 
。 2.16 节 “ 从 映射 表 中 取得 值 ”。 


2.14 使 用 集 操作 


作者 : Luke VanderHart 








问题 
需要 在 集 上 执行 常见 操作 ， 如 并 集 、 交 集 和 差 集 ， 或 测试 一 个 集 是 不 是 另 一 个 集 的 子 集 或 
超 集 。 


解决 方案 
以 下 这 些 函 数 都 是 Clojure 内 建 支持 的 ， 在 clojure.set 命名 空间 中 提供 。 
unton 接受 任意 多 个 集 作为 参数 ， 返 回 它 们 的 并 集 (该 集 包含 所 有 集 的 所 有 元 素 ) : 








(clojure.set/union #{:red :white} #{:white :blue} #{:blue :green}) 
;; -> #{:white :red :blue :green} 


intersection 接受 任意 多 个 集 作为 参数 ， 返 回 它们 的 交集 (该 集 只 包含 所 有 集中 都 有 的 
元 素 ) : 





(clojure.set/intersection #{:red :white :blue} 
#{:red :blue :green} 
#{:yellow :blue :red}) 
;; -> #{:red :blue} 


difference 接受 一 组 集 作为 参数 ， 返 回 集中 的 元 素 在 第 一 个 集中 ， 而 不 在 后 续集 中 : 








(clojure.set/difference #{:red :white :blue :yellow} 
#{:red :blue} 


#{:white}) 
;; -> #{:yellow} 
如 果 subset? 的 第 一 个 参数 是 第 二 个 参数 的 子 集 ， 它 将 返回 true (也 就 是 说 ， 第 一 个 集中 


的 所 有 元 素 都 在 第 二 个 集中 ) : 
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(clojure.set/subset? #{:blue :white} 
#{:red :white :blue}) 
;; -> true 


(clojure.set/subset? #{:blue :black} 
#{:red :white :blue}) 
;; -> false 





superset? 的 工作 方式 与 subset? 相同 ， 不 同 之 处 在 于 ， 当 第 一 个 集 是 第 二 个 集 的 超 集 时 ， 





它 返 回 true。 


你 也 许 注意 到 ，superset? 和 subset? 实际 上 是 等 价 的， 只 是 参数 的 次 序 颠 倒 了 。 


讨论 


一 般 来 说 ， 如 果 适 用 ， 就 应 该 尝试 使 用 这 些 集 操作 函数 。 集 代表 了 一 大 部 分 数据 ， 大 多 数 


开发 者 每 天 都 要 面 对 它 们 ， 不 论 这 些 数据 是 否 被 看 
大 量 的 缺陷 源 于 对 集合 行为 的 假定 。 在 编程 时 ， 








作 集 ,或 显 式 地 建 模 为 集 。 
4 于 某 个 目的 使 用 了 茶 种 数据 结构 类 型 ， 





这 实际 上 是 一 种 信息 传递 ， 从 代码 的 最 初 作者 传递 给 将 来 的 程序 员 ， 说 明了 关于 集合 本 质 
的 一 些 事情 。 集 是 未 排序 的 、 唯 一 的 集合 ， 它 们 强调 的 重点 是 元 素 是 否 属于 集 ， 而 不 是 元 





素 的 次 序 或 出 现 的 次 数 。 








档 ， 说 明了 集中 所 包含 的 数据 的 来 源 和 用 途 。 


参阅 
。 2.13 节 “ 测 试 集成 员 ”。 
。 2.26 节 “ 检 测 集 合 是 否 包含 几 个 值 中 的 一 个 ”。 


2.15 创建 映射 表 


作者 : Luke VanderHart 














问题 
要 创建 一 个 关联 ， 映 射 键 与 值 。 可 能 需要 维持 键 的 


解决 方案 











如 果 数 据 确实 代表 一 个 逻辑 集 ， 那 就 可 以 用 集 这 种 数据 结构 来 建 模 ， 然 后 尝试 以 集 操作 的 
方式 来 考虑 它 的 操作 。 在 很 多 情况 下 ， 你 会 发 现 这 让 程序 更 容易 解释 ， 程 序 本 身 更 像 文 








特定 次 序 。 





利用 映射 表 字 面值 〈 花 括号 ) ， 用 不 同 的 键 和 值 来 创建 简单 的 映射 表 : 
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{:name "" 
:class :barbarian 
:race :half-orc 
:level 20 
:skills [:bashing :hacking :smashing]} 





键 和 值 可 以 古 任意 类 型 。 如 果 其 结构 一 眼看 上 去 难以 区 分 ， 可 以 用 逗号 作为 键 值 对 的 分 
隔 符 : 





{1 1, 8 64, 2 4, 9 81} 








在 Clojure 中 ， 豆 号 是 空白 符 ， 这 意味 着 它们 可 以 用 在 任何 地 方 ， 对 值 没 有 
影响 。 它 只 是 让 代码 更 易 读 的 一 种 方法 。 





要 创建 空 的 、 未 排序 的 映射 表 ， 就 用 一 对 花 括 号 : 


要 创建 具体 类 型 的 映射 表 ， 请 使 用 映射 表 构 造 函 数 。array-map、hash-map 和 sorted-map 
各 自 返 回 对 应 类 型 的 映射 表 : 








(array-map) 


六 2 


(sorted-map :key1 "vaL1" :key2 "val2") 
;; -> {f:keyl "vaL1"” :key2 "val2"} 





如 果 一 个 键 在 参数 列表 中 出 现 多 次 ， 最 终 返 回 的 映射 表 将 采用 最 后 一 个 值 。 
使 用 sorted-map-by 函数 ， 利 用 定制 的 比较 符 来 创建 排序 的 映射 表 : 


(sorted-map-by #(< (count %1) (count %2)) 
"pigs" 14 
"horses" 2 
"elephants" 1 
"manatees" 3) 
;; -> {"pigs" 14, "horses" 2, "manatees" 3, "elephants" 1} 


讨论 
Clojure 映射 表 有 三 种 具体 实现 


。 0 clojure. lang.PersistentArrayMap 
后 是 简单 的 数组 。 它 们 对 很 小 的 映射 表 是 有 效率 的 ， 但 对 于 较 大 的 映射 表 效 率 不 高 。 


。 散 列 映射 表 ，cLojure.Lang.PersistentHashMap 
背后 是 散 列 表 数 据 结 构 。 散 列表 支持 近似 常数 时 间 的 查找 和 插入 ， 但 也 要 求 一 定 的 空间 
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开销 ， 使 用 的 堆 空间 要 多 一 点 。 


。 排序 映射 表 ，cLojure.Lang.PersistentTreeMap 
背后 是 平衡 红 黑 树 。 它 们 比 散 列 映射 表 的 空间 效率 更 高 ， 但 插入 和 访问 的 时 间 要 慢 


一 些 。 





数组 映射 表 是 小 映射 表 的 默认 实现 (在 本 书写 作 时 ， 是 指 少 于 10 个 条 目 ) ， 散 列 映射 表 
是 较 大 映射 表 的 默认 实现 。 排 序 映射 表 只 能 通过 调用 sorted-map 或 sorted-map-by 函数 
来 创建 。 


对 排序 映射 表 使 用 assoc 或 conj， 将 得 到 另 一 个 排序 映射 表 。 但 是 ， 对 数组 映射 表 使 用 
assoc 时 ， 如 果 达 到 一 定 大 小 ， 就 会 返回 散 列 映射 表 。 反 过 来 是 不 成 立 的 ， 对 散 列 映射 表 
使 用 dissoc， 不 会 得 到 数组 映射 表 ， 即 使 它 变 得 非常 小 。 


参阅 

。 1.29 节 “ 比 较 日 期 ”， 以 及 1.17 节 “ 模 糊 比较 ”， 探 讨 了 更 多 比较 的 用 法 。 
。 2.11 节 “ 创 建 集 ”。 

。 2.18 节 “ 设 置 映射 表 中 的 键 ”。 

。 2.24 节 “ 值 的 比较 与 排序 ”。 


2.16 ”从 映射 表 中 取得 值 


作者 : Luke VanderHart 




















i 
I 











问题 

需要 取得 映射 表 中 特定 键 对 应 的 值 。 
解决 方案 

对 于 映射 表 ， 有 几 种 方法 取得 键 对 应 的 值 。 


最 直接 的 方式 是 使 用 get 函数 ， 它 对 给 定 的 映射 表 和 键 ， 返 回 键 对 应 的 值 ， 如 果 映 射 表 不 
包含 该 键 ， 就 返回 nil: 











(get {:name "Kvothe" :class "Bard"} :name) 
;; -> "Kvothe" 


(get {:name "Kvothe" :class "Bard"} :race) 
;; -> nil 























在 需要 时 ， 也 可 以 传 入 第 三 个 参数 ， 作 为 默认 返回 值 。 如 果 映 射 表 不 包含 该 键 ， 就 会 返回 
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这 个 值 ， 而 不 是 nil: 


(get {:name "Kvothe" :class "Bard"} :race "Human") 
;; -> "Human" 











如 果 映 射 表 使 用 关键 字 作为 键 ， 可 以 用 关键 字 本 身 作为 函数 。 关 键 字 实现 了 IFn 接口 ， 以 
映射 表 作 为 参数 调用 时 ， 它 们 会 在 映射 表 中 查找 自己 ， 如 果 存 在 就 返回 值 ， 否 则 返回 nil。 
也 可 以 提供 第 二 个 参数 作为 默认 值 ， 在 查找 不 到 时 返回 ， 就 像 get 那样 : 


























(:name {:name "Marcus" :class "Paladin"}) 
;; -> "Marcus" 


(:race {:name "Marcus" :class "Paladin"} "Human") 
;; -> "Human" 


在 映射 表 中 查找 值 的 第 三 种 方法 ， 就 是 用 映射 表 本 身 作为 函数 ， 将 要 查找 的 键 作为 
。 就 像 get 和 关键 字 函 数 一 样 ， 也 可 以 传 入 第 二 个 参数 作为 默认 值 ， 在 键 查 找 不 到 时 
， 否 则 会 返回 nil: 





























讽 小 池 
孟 六 生 





(def character {:name "Brock" :class "Barbarian"}) 


(character :name) 
;; -> "Brock" 


(character :race) 
;; -> nil 


(character :race "Human") 
;; -> "Human" 





要 查找 敬 套 的 映射 表 ， 有 一 个 方便 的 函数 : get-in。 不 是 传 和 一 个 键 ， 而 是 传 入 键 的 序列 ， 
已 会 连续 查找 区 套 的 结构 ， 就 像 在 舱 套 结构 的 每 一 层 上 反复 调用 get。 未 找到 就 返回 nil: 








(get-in {:name "Marcuys" :weapon {:type :greatsword :damage "2d6"}} 
[:weapon :damage]) 
;; -> "2d6" 


(get-in {:name "Marcus"} 


[:weapon :damage]) 
;; -> nil 


get-in 也 接受 可 选 的 默认 值 ， 如 果 髓 套 层级 中 有 任何 键 未 找到 ， 就 会 返回 它 : 





Re 


(get-in {:name "Marcus"} 
[:weapon :damage] 
"1d2 (fists)") 

;; -> "1d2 (fists)" 


注意 ，get-in 适用 于 所 有 关联 数据 结构 ， 不 只 是 映射 表 。 这 意味 着 它 可 以 组 合 使 用 ， 例 
如 ， 与 向 量 的 索引 一 起 使 用 : 
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(get-in [{:name "Marcus" :class "Paladin"} 
{:name "Kvothe" :class "Bard"} 
{:name "Felter" :class "Druid"}] 
[1 :class]) 

;; -> "Bard" 


讨论 
这 三 种 技术 哪 种 最 好 ? 它们 的 语义 是 一 样 的 ， 但 在 Clojure 的 使 用 习惯 中 ， 它 们 传达 了 不 
同 的 暗示 ， 说 明了 它们 的 适用 范围 。 


通常 ， 用 关键 字 作为 函数 来 查找 ， 表 示 映 射 表 被 作为 “对 象 ”， 键 作为 “字段 "， 其 中 映射 
表 包 含 相 对 较 少 的 、 众 所 周知 的 一 组 键 ， 并 且 可 以 合理 地 假设 ， 键 确实 存在 。 


get 国 数 和 把 映射 表 作 为 国 数 的 查找 技术 则 不 同 ， 它 们 常用 于 较 大 的 映射 表 ， 可 能 的 键 的 
集合 通常 是 开放 的 。 在 这 两 者 之 间 选 择 没 有 太 多 差别 ， 唯 一 的 区 别 是 需要 注意 ， 如 果 出 于 
某 种 原因 ， 提 供 的 映射 表 是 nit， 将 它 用 作 函 数 就 会 抛 出 异常 ， 而 对 nil 使 用 get 就 会 返 
回 nil。 





























同时 也 值得 注意 ， 用 映射 表 本 身 作 为 函数 ， 这 不 仅仅 是 一 种 为 了 简便 的 随意 行为 。 从 
“函数 ”这 个 词 的 技术 意义 上 说 ， 映 射 本 身 就 是 键 到 值 的 函数 。 请 考虑 下 面 的 函数 定义 和 
映射 表 : 

















(defn square [x] (* x x)) 


(def square {1 1, 2 4, 3 9, 4 16, 5 25}) 


使 用 (square 3) 的 调用 形式 时 ， 调 用 者 实际 上 不 知道 square 是 “真正 的 ”函数 还 是 映射 
表 。 当 然 ， 正 常 定义 的 函数 在 这 个 例子 中 有 一 些 优势 。 比 如 说 ， 它 的 定义 域 没有 限制 ， 不 
只 是 列 出 来 的 那些 键 。 乘 法 函数 也 相当 快 ， 所 以 事先 计算 的 结果 没有 优势 。 但 在 某 些 情况 
下 ， 有 些 函 数 确 实 有 自然 约束 的 定义 域 ， 而且 计算 代价 更 大 ， 能 用 函数 的 映射 表 实 现 ， 可 
以 带 来 真实 的 性 能 提升 。 








在 从 映射 表 中 取 值 的 所 有 不 同 技术 中 ， 如 果 键 不 存在 ， 都 会 返回 niL， 所 以 需要 一 些 特殊 
处 理 ， 才 能 区 分 键 存 在 但 值 为 nil 以 及 键 根本 不 存在 的 情况 。 


最 容易 的 办 法 就 是 ， 总 是 提供 默认 值 ， 在 找 不 到 键 时 返回 。 要 绝对 确保 能 够 区 分 默认 值 和 
映射 表 中 可 能 包含 的 值 ， 可 以 使 用 命名 空间 限定 的 关键 字 (如 : :not-found)。 


也 可 以 使 用 contains? 国 数 ， 它 接受 集合 和 键 作为 参数 ， 当 且 仅 当 集合 中 包含 该 键 时 ( 即 
使 值 为 ntL) ， 才 会 返回 true。 
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contains? 的 含义 
contains? 函数 的 确切 行为 常常 导致 困惑 ， 因 为 其 他 许多 语言 都 有 类 似 名 称 的 函数 ， 做 
的 事 却 不 一 样 。 


在 Clojure 中 ，contains? 不 是 一 个 查找 函数 ， 它 不 会 通过 检查 集合 找 出 某 个 元 素 。 准 
确 地 说 ， 它 是 一 个 查 表 函 数 ， 只 适用 于 关联 或 索引 集合 。 在 其 他 语言 中 ， 它 常 被 命名 
为 containsKey 或 类 似 的 名 称 。 

这 意味 着 它 可 以 应 用 于 映射 表 和 集 ， 如 果 指 定 的 键 是 有 效 的 键 ， 或 是 集中 的 成 员 ， 它 
将 返回 true。 但 对 于 向 量 ， 只 有 传 入 的 整数 在 0 和 向 量 的 最 大 索引 之 间 时 ， 它 才 返 回 
true。 如 果 用 于 列表 或 序列 ， 它 将 抛 出 异常 。 





参阅 


2.17 节 “ 从 映射 表 中 同时 取出 多 个 键 ”。 
2.18 节 “ 设 置 映射 表 中 的 键 ”。 
2.20 节 “ 将 映射 表 作 为 序列 (或 反 过 来 )”。 











2.17 ”从 了 映射 表 中 同时 取出 多 个 键 


作者 : Leonardo Borges 


问题 


需要 同时 从 映射 表 中 取出 多 个 值 。 














解决 方案 


如 果 返 回 值 的 次 序 不 重要 ， 就 用 vals 和 select-keys: 

















;; 红豆 和 绿豆 共有 多 少 ? 

(def beans {:red 10 
:blue 3 
:green 1}) 


(reduce + (vals (select-keys beans [:red :green]))) 
;; -> 11 


如 果 次 序 重要 ， 就 用 juxt: 


;; 红豆 和 绿豆 分 别 有 多 少 ? 
((juxt :red :green) beans) 
;; -> [10 1] 
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讨论 
对 于 从 映射 表 中 取出 多 个 键 对 应 的 值 ，juxt 以 及 组 合 使 用 vals 和 select-keys 都 是 适合 的 
工具 。 但 它们 的 行为 有 一 些 细微 差别 :理解 这 些 差 别 很 重要 。 


初 看 上 去 ，juxt 的 方式 似乎 明显 胜出 。 但 仅 限于 初 看 ， 如果 要 取 的 键 有 一 个 不 是 关键 字 
(更 准确 地 说 ， 不 是 函数 )， 这 种 方法 就 会 崩溃 。 这 是 因为 juxt 只 是 并 列 多 个 函数 的 返回 
值 。 因 为 关键 字 是 函数 ， 所 以 可 以 juxt 它们 ， 得 到 严格 排序 的 值 列 表 。 


如 果 beans 映射 表 中 的 键 是 字符 串 ， 就 不 可 能 用 juxt 来 取得 它们 的 值 : 






































((juxt "a" "b") beans) 
;; -> ClassCastException java.lang.String cannot be cast to clojure.lang.IFn ... 


但 是 ，select-keys 能 够 取得 多 个 任意 键 的 值 。select-keys 接受 映射 表 和 键 的 序列 作为 参 
数 ， 返 回 一 个 新 映射 表 ， 基 中 仅 包含 这 些 键 和 对 应 的 值 : 





























(def weird-map {"a" 1, {:foo :bar} :baz, 13 31}) 


(select-keys weird-map 
["a" {:foo :bar}]) 
;; -> {{:foo :bar} :baz, "a" 1} 


(vals {{:foo :bar} :baz, "a" 1}) 
;; -> (1 :baz) 


因为 映射 表 不 是 排序 的 ， 所 以 假定 键 和 值 的 次 序 不 变 是 不 安全 的 (即使 偶然 遇 到 的 例子 中 
是 这 样 )。 如 果 从 非 关 键 字 的 映射 表 中 取得 多 个 值 ， 最 容易 的 方法 可 能 是 用 juxt 将 这 种 交 
互 包装 起 来 : 




















(def a-str-then-foo-bar-map 
(juxt #(get % "a") 
#(get % {:foo :bar}))) 


(a-str-then-foo-bar-map weird-map) 
;; -> [1 :baz] 


现在 你 应 该 能 避 开 古怪 的 映射 表 了 吧 ? 


sh 
kt 


河 
。 2.16 市 “从 映射 表 中 取得 值 ”。 
。 2.19 市 “用 复合 值 作为 映射 表 的 键 ”。 
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2.18 设置 映射 表 中 的 键 


作者 : Luke VanderHart 


问题 

需要 “和 更改” 映射 表 ， 添 加 、 设 置 或 移 除 一 些 键 。 

解决 方案 

更 改 映 射 表 最 基本 的 方法 是 用 assoc 函数 。 它 接受 映射 表 和 任意 数目 的 键 值 对 作为 参数 ， 
返回 更 新 的 映射 表 ， 包 含 相 应 的 键 和 值 。 

















(def villain {:honorific "Dr." :name "Mayhem"}) 

(assoc villain :occupation "Mad Scientist" :status :at-large) 
;; -> {:honorific "Dr.", :name "Mayhem", 

pe :occupation "Mad Scientist", :status :at-large} 








如 果 assco 函数 用 于 已 经 包含 某 个 键 的 映射 表 ， 它 将 返回 更 新 过 的 映射 表 ， 该 键 将 对 应 新 
指定 的 值 ; 























(def villain {:honorific "Dr.", :name "Mayhem", 
:occupation "Mad Scientist", :status :at-large}) 
(assoc villain :status :deceased) 
;; -> {:honorific "Dr.", :name "Mayhem", 
2 :occupation "Mad Scientist", :status :deceased} 


要 移 除 一 些 键 ， 就 用 dissoc 函数 。 它 接受 映射 表 和 任意 数目 的 键 作为 参数 ， 返 回 除去 这 些 
键 的 映射 表 : 





(def villain {:honorific "Dr.", :name "Mayhem", 

:occupation "Mad Scientist", :status :deceased}) 
(dissoc villain :occupation :honorific) 
;; -> {:name "Mayhem", :status :deceased} 


讨论 
映射 表 中 包含 其 他 映射 表 是 很 常见 的 。 如 果 必 须 更 新 深度 嵌 套 的 值 ， 幅 套 调 用 assoc 很 快 
议会 变 得 不 方便 尤其 是 因为 它们 需要 “从 内 到 外 ”。 考 虑 下 面 的 数据 结构 : 


























(def book {:title "Clojure Cookbook" 
:author {:name "Ryan Neufeld" 
:residence {:country "USA"}}}) 


如 果 Ryan 回 到 了 他 的 故乡 加 拿 大 ， 要 只 用 assoc 来 更 新 表示 这 本 书 的 映射 表 ， 看 起 来 就 


是 这 样 : 








(assoc book :author 
(assoc (:author book) :residence 
(assoc (:residence (:author book)) :country "Canada"))) 





显然 ， 这 不 方便 ， 也 难以 阅读 。 














assoc-in 函数 消除 了 这 种 不 便 ， 它 允许 指定 键 路 径 ， 而 不 是 单独 一 个 键 。 键 路 径 列 出 了 键 
的 序列 ， 递 归 地 应 用 ， 改 变 深度 嵌 套 的 值 ， 而 不 是 只 改变 单个 键 深度 的 值 。 











(assoc-in book 
[:author :residence :country] 


"Canada") 
;; -> {:author {:name "Ryan Neufeld" 
3 :residence {:country "Canada"}} 
3 :title "Clojure Cookbook"} 


前 面 的 例子 首先 在 艇 套 的 数据 结构 中 ， 查 找 与 :residence 键 关联 的 映射 表 ， 然 后 将 
"Canada" 与 :country 键 关 联 。 最 后 ， 返 回 整 个 数据 结构 。 








如 有 果 需 要 基于 以 前 的 值 来 更 新 它 ， 而 不 只 是 改变 它 呢 ? 


幸运 的 是 ，Clojure 提供 了 update-in， 专 门 用 于 这 一 目的 。update-in 不 是 接受 一 个 新 值 ， 
而 是 接受 一 个 更 新 函数 。 这 个 函数 被 调用 ， 参 数 是 键 路 径 所 取得 的 值 ， 以 及 传 给 update- 
in 的 后 续 所 有 参数 。 这 初 看 起 来 是 一 个 奇怪 的 函数 。 也 许 最 好 用 例子 来 说 明 : 


(def website {:clojure-cookbook {:hits 1236}}) 





;; 记录 Cookbook 网 站 的 101 次 新 点 击 
(update-in website 


;0 
[:clojure-cookbook :hits] ; @ 
+ ;© 
101) ;@ 
;; -> {:clojure-cookbook {:hits 1337}} 
@ 映射 表 。 
@@ 键 路 径 。 
@ 更 新 函数 ，+。 


@ + 的 其 他 参数 。 


如 果 向 量 中 的 键 不 存在 ，update-in 也 会 为 这 些 键 创建 映射 表 。 这 意味 着 它 可 以 用 于 创建 
结构 ， 同 时 更 新 值 : 




















(update-in {} [:author :residence] assoc :country "USA") 
;; -> {:author {:residence {:country "USA"}}} 


即使 开始 映射 表 是 空 的 ， 也 会 为 :author 和 :residence 键 创建 两 个 空 的 映射 表 ， 这 意味 着 
assoc 将 应 用 于 一 个 新 的 空 映射 表 。 
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像 映 射 表 一 样 对 待 Clojure 的 状态 结构 
映射 表 的 另 一 种 常见 用 法 ， 是 作为 Clojure 状态 结构 的 值 ， 这 些 结 构 是 atom、fref 或 
agent。Clojure 映射 表 的 值 不 是 固定 不 变 的 。 从 字面 来 讲 ， 如 果 你 向 映射 表 “ 增 加 ”一 
个 键 ， 其 值 就 会 发 生变 化 。 但 有 了 时 为 不 同 的 值 保存 逻辑 的 身份 也 是 有 必要 的 。 那 就 这 
扯 到 何 时 使 用 状态 管理 工具 的 问题 。 
要 更 新 一 个 状态 的 值 (ref、atom 或 agent) ， 就 要 调用 其 具体 的 转换 函数 (分别 是 
alter、swap! 和 send) 。 状 态 转换 函数 具有 同样 的 形式 : 它们 接受 引用 作为 第 一 个 参 
数 ， 要 作用 于 值 的 函数 作为 第 二 个 参数 ， 该 也 数 其 他 的 参数 作为 附加 的 参数 。 
所 以 ， 举 例 来 说 ， 要 深度 更 新 映射 表 中 的 一 个 元 素 ， 该 映射 表 由 一 个 atom 引用 ， 就 可 
以 调用 swap! 函数 (atom 的 状态 转换 函数 ) ， 将 atom 和 update-in 函数 传递 给 它 ， 再 
加 上 键 的 列表 和 用 于 更 新 该 值 的 涵 数 : 
(def retail-data (atom {:customers [{:id 123 :name "Luke"} 
{:id 321 :name "Ryan"}] 


:orders [{:sku "Q2M9" :customer 123 :qty 4} 
{:sku "43XP" :customer 321 :qty 1}]})) 


(swap! retail-data update-in [:orders] conj 
{:sku "9QED" :customer 321 :qty 2}) 
这 会 在 订单 列表 中 添加 一 个 新 的 订单 映射 表 ， 订 单列 表 在 一 个 映射 表 中 ， 映 射 表 在 
retail-data atom 中 。 
尽管 这 种 三 重组 合 不 太 常 见 ， 但 它们 说 明了 函数 的 总 体 一 致 性 ， 即 接受 其 他 函数 和 参 
数 作为 参数 ， 也 说 明了 它们 能 够 实现 任意 深度 的 上 峙 套 。 在 这 个 例子 中 ， 从 调用 swap! 
开始 ， 结 果 也 以 同样 的 方式 更 新 了 映射 表 ， 连 结 了 向 量 。 











阅 
2.20 节 “ 将 映射 表 作 为 序列 (或 反 过 来 )”。 


2.22 节 “ 一 个 键 保 存 多 个 值 ”。 
。 2.23 节 “ 合 并 映射 表 ”。 


2.19 用 复合 值 作 为 映射 表 的 键 


作者 : Luke VanderHart 


sh 




















问题 
要 用 一 个 值 作为 映射 表 中 的 查找 键 ， 但 它 不 是 简单 的 原生 类 型 。 例 如 : 








。 要 用 地 理 坐标 或 笛 卡 儿 坐标 作为 映射 表 的 键 ， 
。 希望 关联 一 些 值 和 一 些 函 数 。 


解决 方案 
因为 Clojure 对 复合 值 有 强大 的 标识 语义 ， 所 以 完全 支持 用 任何 不 变 的 值 作为 映射 表 的 键 。 
更 重要 的 是 ， 这 样 做 效率 更 高 。 
































例如 ， 考 虑 代表 国际 象棋 棋盘 的 数据 结构 ，8 x 8 的 格子 ， 每 个 位 置 可 以 放 六 种 棋子 中 的 一 
种 。 行 用 数字 1 至 8 表示， 列 用 字母 a 至 h 表示 。 





在 Clojure 中 ， 可 以 将 它 直接 表示 为 映射 表 

(def chessboard {[:a 5] [:white :king] 
:a 4] [:white :pawn] 
:d 


[ 
[:d 4] [:bLack :king]}) 





移动 棋子 需要 两 个 操作 ，dissoc 老 的 位 置 ，assoc 新 的 位 置 : 


(defn move 
"Given a map representing a chessboard, move the piece at src 
to dest" 
[board source dest] 
(-> board 
(dissoc source) 
(assoc dest (board source)))) 


(move chessboard [:a 5] [:a 4]) 

;; -> {[:d 4] [:black :king] 

2 [:a 4] [:white :king]} 
作为 非 传统 映射 表 键 的 另 一 个 例子 ， 请 考虑 这 种 情况 : 有 一 组 函数 ， 要 能 够 指定 每 个 函数 
的 “权重 ”， 并 在 函数 被 调用 时 ， 用 返回 值 乘 以 对 应 的 权重 。 














一 种 容易 的 实现 方法 是 将 函数 和 权重 保存 在 映射 表 中 ， 以 函数 作为 键 : 


(def plus-two (partial + 2)) 

(def plus-three (partial + 3)) 

(def weight-map {plus-two 1.0 
plus-three 0.8}) 


然后 用 一 个 简单 的 包装 函数 ， 调 用 函数 以 及 适用 的 权重 : 


(defn apply-weighted 
"Given a weight map, a function, and args, applies the function 
to the args, multiplying the result by the weighting for the 
function. If the weight map does not specify a weight for the 
function, a default of 1.0 is used." 
[weight-map f & args] 
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(* (get weight-map f 1.0) 
(apply f args))) 


(apply-weighted weight-map plus-two 2) 
;; -> 4.0 


(apply-weighted weight-map plus-three 1) 
3 D3.2 


讨论 
使 用 两 维 数组 是 象棋 游戏 建 模 的 传统 方式 ， 在 Clojure 中 ， 就 是 用 向 量 的 向 量 。 




















这 样 做 肯定 是 合理 的 ， 而 且 (可 能 ) 性 能 好 一 点 点 。 但 是 ， 这 个 模型 对 现实 问题 来 说 没 那 
么 清晰 。 比 方 说 ， 它 需要 将 象棋 的 行列 数字 和 字母 翻译 成 向 量 的 索引 。 使 用 映射 表 能 直接 
存储 位 置 ， 用 象棋 本 身 的 术语 。 
类 似 地 ， 函 数 权重 的 例子 也 有 另外 的 实现 方式 。 可 以 用 cond 语句 来 实现 ， 列 出 所 有 函数 和 


权重 ,或 者 用 一 个 协议 方法 (protocol method) 取代 所 有 的 函数 ， 然 后 有 带 不 同 权重 的 各 
种 实现 。 


但 是 ， 将 函数 和 权重 保存 在 映射 表 中 ， 好 处 是 一 眼 就 能 看 出 某 个 国 数 的 权重 是 多 少 。 更 重 
要 的 是 ， 有 可 能 保存 多 组 不 同 的 权重 ， 运 行 时 动态 更 换 不 同 的 权重 策略 。 






































参阅 
。 2.16 节 “ 从 映射 表 中 取得 值 ”，2.18 节 “ 设 置 映射 表 中 的 键 ”。 


2.20 ”将 映射 表 作 为 序列 (或 反 过 来 ) 


作者 : Luke VanderHart 














问题 
需要 将 映射 表 的 内 容 作 为 条 目 序列 。 或 者 ， 需 要 将 条 目 序 列 转 成 映射 表 。 
解决 方案 





要 得 到 映射 表 的 序列 视图 ， 只 要 对 它 调用 seq。 注 意 ， 大 多 数 序列 处 理 函 数 自己 会 在 参数 
上 调用 seq， 所 以 通常 不 需要 显 式 地 调用 seq: 


(seq {:a 1, :b 2, :c 3, :d 4}) 
;; -> ([:a 1] [:c 3] [:b 2] [:d 4]) 








这 创建 了 一 个 键 值 对 序列 ， 然 后 可 以 像 处 理 其 他 序列 一 样 处 理 它 了 。 
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要 从 序列 创建 映射 表 ， 可 以 利用 conj 函数 的 一 个 特点 ， 即 它 在 应 用 于 映射 表 时 ， 可 以 接受 
两 个 元 素 的 向 量 ， 作 为 键 值 对 ， 将 其 添加 到 映射 表 中 : 


(def m {:a 1, :b 2}) 
(conj 





























WW si 


C 
TD 


因为 into 函数 反复 应 用 conj， 将 元 素 从 一 个 序列 放 到 一 个 集合 中 ， 所 以 可 以 用 它 将 键 值 
对 序列 转换 成 一 个 映射 表 

(into {} [[:a 1] [:b 2] [:c3]]) 

; -> {:a 1, :b 2, :c 3} 
也 可 以 从 两 个 序列 构造 一 个 映射 表 ， 一 个 包含 键 ， 另 一 个 包含 值 。 这 就 是 zipmap 函数 的 
功能 。 给 定 两 个 序列 ， 它 将 返回 一 个 映射 表 ， 键 来 自 第 一 个 参数 序列 ， 值 来 自 第 二 个 参数 
序列 : 























(zipmap [:a :b :cl [1 2 3]) 
; -> {:c 3, :b 2, :a 1} 


传递 给 zipmap 的 两 个 序列 ， 如 果 一 个 比较 短 ， 多 余 的 值 就 会 被 忽略 ， 得 到 的 映射 表 和 较 短 
的 序列 一 样 长 。 


讨论 

在 获取 散 列 映 射 表 的 序列 视图 时 ， 返 回 的 映射 表 项 的 次 序 是 任意 的 ， 或 未 定义 的 。 也 有 一 
点 便利 ， 如 果 同 一 个 映射 表 多 次 转换 成 序列 ， 这 个 次 序 (尽管 任意 ) 是 确保 一 致 的 。 

在 使 用 排序 映射 表 时 ， 条 目 返 回 的 次 序 是 它们 在 映射 表 中 的 排序 次 序 。 例 如 : 























(seq (hash-map :a 1, :b 2, :c 3, :d 4)) 
;; -> ([:a 1] [:c 3] [:b 2] [:d 4]) 


(seq (sorted-map :a 1, :b 2, :c 3, :d 4)) 

; -> ([:a 1] [:b 2] [:c 3] [:d 4]) 
关于 这 个 序列 中 的 条 目 值 ， 还 有 一 个 有 趣 的 事实 。 它 们 被 当 作 向 量 输出 ， 而 且 它 们 就 是 
向 量 ， 因 为 它们 实现 了 完整 的 向 量 接口 。 但 是 它们 的 有 具体 类 型 实际 上 不 是 clojure.lang. 
PersistentVvector， 而 是 一 种 不 同类 型 的 向 量 ， 名 为 映射 表 条 目 ， 它 不 仅 是 向 量 ， 也 支持 
cLojure.Lang.MapEntry 接口 。 




















TI 





MapEntry 接口 提供 了 key 和 val 函数 ， 用 于 取得 条 目的 键 和 值 : 











(def entry (first {:a 1 :b 2})) 


(class entry) 
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;; -> clojure.lang.MapEntry 


(key entry) 


3 


(val entry) 
2 2 


在 将 映射 表 作 为 序列 时 ， 对 映射 表 条 目 应 该 优先 选择 这 些 函 数 ， 而 不 是 first 和 second 国 
数 ， 因 为 它们 保留 了 键 值 对 的 语义 ， 让 代码 更 容易 阅读 。 


参阅 


。 2.21 市 “对 映射 表 应 用 函数 ”。 


2.21 ”对 映射 表 应 用 函数 


作者 : Luke VanderHart 


问题 
要 对 映射 表 的 键 或 值 应 用 转换 函数 。 
解决 方案 


使 用 下 面 简单 的 通用 函数 ， 改 变 参数 来 满足 各 种 需要 : 





























(defn map-keys 
"Given a map and a function, returns the map resulting from applying 
the function to each key." 
[m f] 
(zipmap (map f (keys m)) (vals m))) 


(map-keys {"a" 1 "b" 2} keyword) 
;; -> {:b 2, :a 1} 


(defn map-vals 
"Given a map and a function, returns the map resulting from applying 
the function to each value." 
[m f] 
(zipmap (keys m) (map f (vals m) ))) 


(map-vals {:a 1, :b 1} inc) 
;; -> {:b 2, :a 2} 


(defn map-kv 
"Given a map and a function of two arguments, returns the map 
resulting from applying the function to each of its entries. The 





provided function must return a pair (a two-eLement sequence.)" 
[m f] 
(into {} (map (fn [[k v]] (fk v)) m))) 


(map-kv {"a" 1 "b" 1} (fn [k v] [(keyword k) (inc v)])) 
;; -> {:a 2, :b 2} 


讨论 

map-keys 和 map-vals 非常 简单 明了 。 它 们 开始 都 用 keys 和 vals 国 数 ， 将 映射 表 m 分 解 成 
键 的 序列 和 值 的 序列 。 然 后 它们 利用 map 函数 ， 转 换 键 序列 或 值 序列 。 最 后 ， 用 zipmap 也 
数 将 键 序列 和 值 序列 合并 成 一 个 映射 表 ， 更 新 就 完成 了 。 


map-kv 有 点 不 一 样 。 它 开始 将 映射 表 转 换 成 映射 表 条 目的 序列 ， 然 后 利用 map， 对 它们 应 
用 一 个 匿名 函数 ， 解 构 键 和 值 ， gt de we de 
将 得 到 的 键 值 对 连接 到 一 个 空 映射 表 中 ， 返 回 新 的 映射 表 ， 包 含 转换 过 的 键 和 值 。 


下 面 的 例子 是 等 价 的 ， 但 没有 用 解构 ， 所 以 高 层 结构 更 清楚 一 些 : 



























































(defn map-kv 
[m f] 
(into {} (map (fn [entry] 
(f (key entry) (val entry))) 
m))) 


显而易见 ， 这 三 个 函数 都 是 标准 map 函数 应 用 于 映射 表 数 据 结构 的 即兴 发 挥 。 另 一 个 函数 
式 编程 的 主力 reduce 呢 ? 

Clojure 已 经 自 带 了 reduce-kv 函数 ， 是 在 1.4 版 中 添加 的 。reduce-kv 接受 三 个 参数 : 一 个 
半数 、 一 个 初始 值 ， 和 一 个 关联 和 集合。 提供 的 函数 也 必须 接受 3 个 参数 。reduce-kv 对 提 
供 的 集合 进行 归 约 ， 先 将 函数 应 用 于 初始 值 、 映 射 表 的 第 一 个 键 和 值 ， 再 是 结果 值 、 第 
个 键 和 值 ， 再 是 结果 值 、 第 三 个 键 和 值 ， 以 此 类 推 。 


下 面 的 例子 用 reduce-kv 来 得 到 映射 表 中 所 有 值 之 和 : 




























































































(reduce-kv (fn [agg _ valL] 
(+ agg val)) 
0 
{:a 1 :b 2 :c 3}) 
;->6 


注意 ， 在 函数 的 参数 声明 中 ， 下 划 线 (_) 代替 了 key。 这 是 Clojure 中 的 习惯 用 法 ， 命 名 
函数 体 中 实际 上 不 会 用 到 的 参数 。 





也 可 以 用 reduce-kv 重新 定义 map-kv: 
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(defn map-kv 
[m f] 
(reduce-kv (fn [agg k v] (conj agg (fkv))) {} m)) 





可 以 用 在 这 个 例子 中 : 


(map-kv {:one 1 :two 2 :three 3} 
#(vector (-> %1 str (subs 1)) (inc %2))) 
;; -> {"one" 2, "three" 4, "two" 3} 


2.20 节 “ 将 映射 表 作 为 序列 〈 或 反 过 来 )。 


2.22 ”一 个 键 保存 多 个 值 


作者 : Luke VanderHart 


通常 ， 映 射 表 中 每 个 键 严格 地 对 应 一 个 值 ， 如 果 assoc 一 个 已 有 的 键 ， 原 来 的 值 就 会 被 赤 
换 。 但 是 ， 有 时 候 要 用 到 类 似 映射 表 的 接口 (“多 重 映 射 表 ”)， 能 在 一 个 键 下 保存 多 个 值 。 


需要 在 Clojure 中 创建 一 个 类 似 映 射 表 的 数据 结构 ， 实 现 类 似 多 重 映射 表 的 接 
解决 方案 


为 了 在 普通 映射 表 的 基础 上 引入 这 种 能 力 ， 就 要 创建 并 扩展 MultiAssociative 协议 ， 定义 
这 种 行为 : 


























(defprotocol MultiAssociative 
"An associative structure that can contain multiple values for a key" 
(insert [m key vaLue] "Insert a value into a MultiAssociative") 
(delete [m key vaLue] "Remove a value from a MultiAssociative") 
(get-all [m key] "Returns a set of all vaLues stored at key in a 
MultiAssociative. Returns the empty set if there 
are no values.")) 


(defn-value-set? 
"Helper predicate that returns true if the value is a set that 
represents multiple values in a MultiAssociative" 
[v] 
(and (set? v) (::multi-valuye (meta v)))) 


(defn value-set 
"Given any number of items as arguments, returns a set representing 
multiple values in a MultiAssociative. If there is only one itenm, 





simply returns the item." 
[& items] 
(if (= 1 (count items)) 
(first items) 
(with-meta (set items) {::multi-value true}))) 


(extend-protocol MultiAssociative 
clojure. lang.Associative 
(insert [this key valuel] 
(let [v (get this key)] 
(assoc this key (cond 
(nil? v) value 
(vaLue-set? v) (conj v value) 
:else (vaLue-set v vaLue))))) 
(delete [this key valuel] 
(let [v (get this key)] 
(if (value-set? v) 
(assoc this key (apply value-set (disj v value))) 
(if (= v value) 
(dissoc this key) 
this)))) 
(get-all [this key] 
(let [v (get this key)] 
(cond 
(value-set? Vv) v 
(nil? v) #{} 
:else #{v})))) 


| 





然 ， 还 有 对 应 的 单元 测试 利用 ctojure.test) : 





(require '[clojure.test :refer :all]) 


(deftest test-insert 
(testing "inserting to a new key" 
(is (= {:k :v} (insert {} :k :v)))) 
(testing "inserting to an existing key (single existing item)" 
(let [m (insert {} :k :v1)] 
(is (= {:k #{:v1 :v2}} 
(insert m :k :v2))))) 
(testing "inserting to an existing key (multiple existing items)" 
(let [m (insert (insert {} :k :v1) :k :v2)] 
(ts (= {:k #{:v1 :v2 :v3}} 
(insert m :k :v3)))))) 


(deftest test-delete 

(testing "deleting a non-present key" 

(is (= {:k :v} (delete {:k :v} :nosuch :nada)))) 
(testing "deleting a non-present value" 

(is (= {:k :v} (delete {:k :v} :k :nada)))) 
(testing "deleting a single value" 

(is (= {} (delete {:k :v} :k :v)))) 
(testing "deleting one of two values" 

(let [m (insert (insert {} :k :v1) :k :v2)] 

(is (= {:k :v1} (delete m :k :v2))))) 
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(testing "deleting one of several values" 
(let [m (insert (insert (insert {} :k :v1) :k :v2) :k :v3)] 
(is (= {:k #{:v1 :v2}} (delete m :k :v3)))))) 


(deftest test-get-all 
(testing "get a non-present key" 
(is (= #{} (get-all {} :nosuch)))) 
(testing "get a single valuye" 
(is (= #{:v} (get-all {:k :v} :k)))) 
(testing "get multiple values" 
(is (= #{:v1 :v2} (get-all (insert (insert {} :k :v1) :k :v2) :k))))) 


(run-tests) 
;; -> {:type :summary, :pass 11, :test 3, :error 0, :fail 0} 


讨论 
首先 ， 这 段 代码 定义 了 一 个 协议 来 实现 一 组 构成 多 重 映射 表 的 行为 的 函数 。 在 这 种 情况 
下 ， 协 议 是 很 好 的 选择 : 它 将 几 个 方法 捆绑 在 一 起 ， 在 同样 的 对 象 上 执行 相关 的 操作 ， 并 
且 允 许多 种 具体 实现 。 








在 这 个 例子 中 ， 要 实现 期 望 的 功能 ， 需 要 三 个 方法 。 注 意 ， 协 议 的 实现 没有 履 写 或 重新 实 
现 核心 的 映射 表 方法 (assoc、dissoc 等 )。 它 只 是 新 行为 的 语义 ， 区 别 于 那些 普通 的 映射 
表 。 围 绕 这 些 核心 国 数 ，Clojure 定义 了 非常 强大 的 语义 。 破 坏 或 覆 写 这 些 预期 的 语义 总 是 
不 好 的 ， 尤 其 是 如 果 使 用 一 组 不 同 的 函数 ， 能 清楚 地 说 明 何 时 用 到 多 重 映 射 表 的 功能 ， 覆 
写 就 更 不 好 了 。 








MultiAssociative 的 具体 实现 将 该 协议 扩展 到 clojure.lang.Associative 接口 。 肯 定 可 以 
实现 为 更 有 针对 性 的 东西 ， 比 如 IPersistentset， 但 因为 它 实 现时 只 要 求 有 关联 的 东西 ， 
所 以 最 好 不 要 太 具 体 。 针 对 clojure.lang.Associative 来 编码 也 顺便 提供 了 几 种 额外 的 能 
力 。 例 如 ， 现 在 自然 有 了 “多 重 向 量 *"， 能 够 在 每 个 索引 处 保存 多 个 值 (只 要 它们 是 通过 
insert 添加 的 )。 





























阅读 这 段 代 码 ， 你 会 注意 到 ， 许 多 多 辑 实际 上 是 要 确保 单 值 简单 地 存储 ， 多 重 值 包装 在 集 
中 。 这 在 插入 和 删除 元 素 时 得 到 保持 ， 要 求 这 些 函 数 检查 值 的 类 型 ， 相 应 进行 包装 或 解 
包 。 类 似 地 ，get-all 需要 将 单 值 包装 成 集 再 返回 ， 因 为 规定 它 必须 返回 集 。 

这 是 设计 决定 ， 有 利 有 次。 也 可 以 总 是 把 值 包装 在 集中 ， 就 算 单 值 也 这 样 。 这 会 让 代码 简 
和 一 此 
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但 是 ， 简 单 是 有 代价 的 。 如 果 值 ( 黄 至 单 值 ) 总 是 包装 在 集中 ， 作 为 多 重 映射 表 的 映射 表 
就 不 容易 通过 普通 的 映射 表 函 数 来 使 用 。 它 会 包含 许多 看 起 来 奇怪 的 单元 素 集 ， 而 且 如 果 
用 assoc 来 添加 元 素 ， 就 会 和 将 来 对 该 键 使 用 insert 不 兼容 。 

















本 质 上 ， 包 装 和 解 包 是 允许 映射 表 既 能 用 标准 的 Associative 接 








口 ， 也 能 用 MultiAssociative 





接口 ， 不 要 求 用 户 记 住 它 是 “ 哪 种 ”映射 表 。 用 assoc 插入 的 值 ， 可 以 用 get-all 读 取 ， 
用 ;insert 插入 的 值 ， 可 以 用 dissoc 移 除 。 所 有 对 普通 的 映射 表 的 期 望都 是 成 立 的 。 如 果 对 
多 值 的 键 调用 普通 的 get， 将 返回 包含 多 个 元 素 的 集 。 这 可 能 是 用 户 检查 数据 时 所 期 望 的 。 


这 段 代码 还 有 一 点 值得 说 明 ， 它 在 保存 多 值 的 集 上 ， 使 用 了 ::multivalue 元 数据 ， 通 过 





























value-set 和 value-set? 国 数 实 现 和 测试 。 























这 样 做 是 为 了 处 理 一 种 特殊 情况 ， 即 键 对 应 的 值 本 身 是 一 个 集 。 代 码 需要 一 种 方法 ， 来 确 


认 什么 是 为 了 管理 多 值 而 创建 的 集 ， 什 么 是 用 户 作为 单 值 提供 














的 集 。 





实现 机 制 是 在 为 多 值 而 创建 的 集中 加 上 元 数据 。 使 用 一 个 命名 空间 限定 的 关键 字 ， 来 确保 
它 不 会 与 用 户 提 供 的 值 的 元 数据 发 生 冲 突 。 然 后 ， 代 码 要 做 的 就 是 检查 集 是 否 有 : :multi- 























value 元 数据 ， 就 知道 它 是 包含 多 值 的 集 ， 还 是 本 身 就 是 值 。 








参阅 
。 3.10 节 “扩展 内 建 的 类 型 ”。 


2.23 ”合并 映射 表 


作者 : Tom Hicks 


问题 
需要 将 两 个 或 多 个 映射 表 合 并 为 一 个 。 


， 
解决 方案 
用 merge 来 合并 两 个 或 多 个 没有 相同 键 的 映射 表 : 
(def arizona-bird-counts {:cactus-wren 8}) 
(def florida-bird-counts {:gull 20 :pelican 14}) 


(merge florida-bird-counts arizona-bird-counts) 
;; -> {:pelican 14, :cactus-wren 8, :gull 20} 











如 有 果 多 个 映射 表 中 有 相同 的 键 ， 需 要 明确 控制 合并 的 策略 ， 就 用 merge-with: 





(def florida-bird-counts {:gull 20 :pelican 1 :egret 4}) 
(def california-bird-counts {:gull 12 :pelican 4 :jay 3}) 


;; 用 + 合并 值 ， 求 得 和 


(merge-with + california-bird-counts florida-bird-counts) 


;; -> {:pelican 5, :egret 4, :gull 32, :jay 3} 
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讨论 
对 于 merge 和 merge-with， 映 射 表 的 合并 都 是 从 左 到 右 ， 返 回 不 可 变 的 新 映射 表 。 这 些 函 
数 就 像 “ 左 折 释 ”"。merge 比较 简单 ， 总 是 返回 看 到 的 每 个 键 的 最 后 一 个 值 。 









































如 果 同 一 个 键 的 映射 出 现在 多 个 映射 表 中 ， 结 果 将 采用 后 出 现 的 映射 。 这 可 能 是 有 用 的 ， 
例如 ， 如 果 在 一 天 中 多 次 收 到 新 的 总 数 ， 但 只 针对 那些 改变 的 值 : 


;; 一 天 中 最 喜爱 的 冰淇淋 口味 投票 

(def votes-am {:vanilla 3 :chocolate 5}) 

(def votes-pm {:vanilla 4 :neapoliton 2}) 
(merge votes-am votes-pm) 

;; -> {:vanilla 4, :chocolate 5, :neapoliton 2} 



































merge-with 为 映射 表 合 并 提供 了 强大 的 能 力 ， 允 许 控 制 值 合并 的 方式 。 可 以 将 merge-with 
看 成 是 reduce 了 多 个 映射 表 中 同样 的 键 。merge-with 的 第 一 个 参数 是 一 个 合并 函数 ， 供 每 
一 对 复制 的 值 调用 。 
通过 仔细 选择 映射 表 中 值 的 类 型 ，merge-with 为 一 些 常 见 问 题 提 供 了 简明 的 解决 方案 。 例 
如 ， 通 过 带 clojure.set/intersection 的 合并 ， 可 以 找到 团队 中 程序 员 “ 喜 欢 ” 和 “不 喜 
欢 ” 的 交集 : 


























(def Alice {:Loves #{:clojure :lisp :scheme} :hates #{:fortran :C :c++}}) 

(def Bob {:loves #{:clojure :scheme} :hates #{:c :C++ :algol}}) 

(def Ted {:loves #{:clojure :lisp :scheme} :hates #{:algol :basic :c 
:C++ :fortran}}) 


(merge-with clojure.set/intersection Alice Bob Ted) 
;; -> {:loves #{:scheme :clojure}, :hates #{:c :c++}} 


也 可 以 创建 一 个 递归 合并 函数 ， 合 并 侯 套 的 映射 表 。 





(defn deep-merge 
[& maps] 
(apply merge-with deep-merge maps)) 
(deep-merge {:foo {:bar {:baz 1}}} 
{:foo {:bar {:qux 42}}}) 
;; -> {:foo {:bar {:qux 42, :baz 1}}} 


在 前 面 的 例子 中 可 以 看 到 ，merge-with 是 一 个 多 功能 的 工具 ， 我 们 可 以 用 + 来 加 总 相同 键 
的 值 ， 用 clojure.set/intersection 来 找 出 多 个 集中 都 有 的 值 ， 用 递归 函数 deep-merge 来 
递归 地 合并 嵌 套 的 映射 表 。merge-with 确实 是 一 个 非常 强大 的 函数 。 











。 2.18 节 “ 设 置 映射 表 中 的 键 ”。 
。 2.22 节 “ 一 个 键 保 存 多 个 值 ”。 
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2.24 值 的 比较 与 排序 


作者 : Luke VanderHart 


问题 

要 根据 某 个 比较 函数 来 比较 两 个 值 ， 或 通过 比较 集合 中 的 所 有 元 素 ， 对 集合 排序 

解决 方案 

用 clojure.core/compare 国 数 来 比较 两 个 值 。 它 们 必须 是 相互 可 比较 的 。 例 如 ，doublte 可 
以 和 有 理 数 比 较 ， 因 为 它们 都 是 数值 ， 但 字符 串 不 能 与 向 量 比较 。 


如 有 果 第 一 个 参数 小 于 第 二 个 参数 ，compare 就 返回 负数 ， 等 于 就 返回 0， 大 于 就 返回 正 数 : 























(Compare 5 2) 
人 


(compare 0.5 1) 
2 


(compare (/ 1 4) 0.25) 
;; ->0 


(compare "brewer" "aardvark") 
; ->1 


要 比较 整个 集合 ， 就 将 它 传 递 给 clojure.core/sort 函数 。sort 根据 需要 来 应 用 compare， 
返回 排 好 序 的 序列 。 


例如 ， 下 面 的 代码 将 一 个 字符 串 分 解 为 字符 序列 (sort 对 它 的 参数 调用 seq)， 然 后 对 它们 
排序 。 结 果 重 新 连接 成 字符 串 ， 这 样 可 读 性 较 好 : 


























(appty ， str (sort "The quick brown fox jumped over the Lazy dog")) 
;; -> Tabcddeeeefghhijklmnoooopqrrtuuvwxyz" 





正如 前 面 看 到 的 ，Clojure 的 许多 数据 类 型 都 有 自然 比较 次 序 ， 这 就 是 compare 所 用 的 次 
序 。 例 如 ， 数 字 、 日 期 、 字 符 串 都 像 预 期 那样 排序 ， 从 低 到 高 ， 基 于 大 家 都 理解 和 接受 的 
固有 次 序 。 














如 果 需 要 排序 的 类 型 没有 自然 次 序 ， 或 需要 履 写 自然 次 序 (比如 从 高 到 低 排 序 )， 也 可 以 
不 用 内 建 的 比较 函数 。sort 允许 指定 一 个 定制 的 比较 函数 ， 执 行 期 望 的 操作 ， 来 决定 两 个 
元 素 之 间 的 相对 次 序 。 这 个 函数 必须 接受 两 个 参数 。 它 可 以 像 compare 那样 返回 值 (也 就 
是 说 ， 正 整数 、 负 整数 或 0) ， 或 者 返回 布尔 值 (也 就 是 一 个 谓词 国 数 )。 当 且 仅 当 第 一 个 
参数 应 该 排 在 第 二 个 参数 前 面 时 ， 这 个 谓词 函数 才 应 该 返回 true。 
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这 意 昧 着 可 以 将 普通 的 Clojure 谓词 传递 给 sort: 


(sort > [1 4 3 2]) 
;; -> (4321) 


(sort < [1 4 3 2]) 
;; -> (1 2 3 4) 


或 者 ， 也 可 以 编写 自己 的 比较 函数 。 例 如 ， 下 面 例子 中 ， 定 制 的 比较 函数 只 关心 字符 串 的 长 
度 ， 不 关心 其 内 容 。 如 果 字 符 串 具有 同样 多 的 字符 ， 它 们 就 被 判 为 相等 ， 不 论 字符 是 什么 : 




















(sort #(< (count %1) (count %2)) ["z" "yy" "zzz" "a" "bb" "ccc"]) 
a sy 外 2 0 "yy" hb Wp py "ccc") 


讨论 

在 背后 ，Clojure 使 用 了 Java 内 建 的 排序 机 制 。Java 使 用 了 稍 加 修改 的 归并 排序 算法 ， 在 
绝 大 多 数 情况 下 效率 都 很 高 。 它 在 最 坏 的 情况 下 需要 n log(n) 次 比较 ， 如 果 输 入 已 经 相当 
有 序 ， 则 性 能 接近 O(n)。 


排序 也 是 稳定 的 ， 这 意味 着 如 有 果 比 较 函 数 判断 两 个 元 素 相 等 ， 它 们 的 相对 位 置 在 排序 后 不 
会 改变 。 
尽管 可 以 使 用 任何 谓词 作为 比较 函数 ， 或 编写 自己 的 比较 函数 来 返回 正 整数 、 负 整数 或 0， 
但 实际 的 函数 必须 行为 正确 ， 才 能 有 效 。 具 体 来 说 ， 它 必须 : 



































。 对 于 所 有 被 排序 的 元 素 具 有 一 致 的 全 序 
如 果 x 排 在 y 前 面 ,，y 排 在 z 前 面 ， 那么 x 必须 总 是 排 在 z 前 面 。 换 句 话 说， 对 于 给 定 
的 集合 和 比较 函数 ， 必 须 总 是 有 唯一 的 完全 确定 的 次 序 ， 排 序 函 数 不 会 导致 任何 冲突 或 
不 一 致 。 
































。 与 .equals 肠 数 及 Clojure 的 = 函数 一 致 
如 果 两 个 元 素 在 逻辑 上 相等 ， 那 么 就 必须 反映 在 比较 函数 中 。 如 果 使 用 整数 返回 值 ， 国 
数 就 应 该 返回 6。 如 果 使 用 谓词 函数 ， 如 果 x 和 y 相等 ，(pred x y) 和 (pred y x) 应 该 
返回 同样 的 值 。 























。 没有 副作用 

在 排序 过 程 中 ， 比 较 函 数 可 能 被 调用 任意 次 。 

比较 函数 与 JVM 

Clojure 完全 参与 了 Java 的 比较 与 排序 机 制 。 有 自然 次 序 的 所 有 Clojure 对 象 ， 都 实现 了 


java.Lang.ComparabLe (http://docs.oracle.com/javase/7/docs/api/java/lang/Comparable.htm!l) 
接口 ， 实 现 了 compareTo 方法 。 














更 重要 的 是 ， 每 个 Clojure 函数 确实 实现 了 java.util.Comprator (http://docs.oracle.com/ 
javase/7/docs/api/java/uti/Comparator.html) 接口 。 这 意味 着 ， 可 以 将 Clojure 函数 传递 给 任 
何 需 要 java.util.Comparator 的 Java 方 法 ， 它 将 用 两 个 参数 来 调用 该 函数 。 这 种 机 制 允 
许 将 任意 Clojure 函数 作为 比较 方法 传递 给 sort。 函 数 对 象 本 身 实际 上 被 用 作 Java 的 比较 
器 ， 在 Clojure 函数 上 调用 Java 的 .compare 方法 实际 会 调用 该 函数 ， 要 比较 的 两 个 值 将 作 
为 参数 传递 给 它 。 


因为 谓词 函数 (返回 Boolean 值 的 函数 ) 不 能 准确 对 应 预期 来 自 java.util.Comparator 的 
返回 值 ， 即 正 整 数 、 负 整数 和 0， 所 以 Clojure 自己 负责 它们 之 间 的 逻辑 映射 。 如 果 用 作 
比较 方法 的 函数 ( 即 (pred x y)) 返回 true， 实 现 将 返回 -1， 表 明 在 给 定 的 次 序 中 ，x 小 
于 y。 如 果 不 是 ， 它 会 将 参数 反 过 来 ， 再 调用 该 函数 。 如 果 (pred x y) 和 (pred y x) 都 是 
false， 它 就 认为 这 两 个 对 象 是 相等 的 ， 实 现 将 返回 9。 否则 ， 它 认为 x 大 于 y， 返 回 1。 























sort-by 

有 时 候 ， 和 希望 集合 排序 时 不 是 根据 值 本 身 ， 而 是 根据 值 的 导出 函数 。 例 如 ， 假 定 有 如 下 
数据 ， 需 要 按 名 称 的 字母 顺序 排序 。 不 幸 的 是 ， 映 射 表 没有 自然 顺序 ， 所 以 需要 告诉 
Clojure， 如 何 对 数据 排序 : 




















(def people [{:name "Luke" :role :author} 
{:name "Ryan" :role :author} 
{:name "John" :role :reviewer} 
{:name "Travis" :role :reviewer} 
{:name "Tom" :role :reviewer} 


{:name "Meghan" :role :editor}]) 


一 种 选择 是 使 用 定制 的 比较 方法 ， 它 提取 :name 键 ， 然 后 调用 compare: 





(sort #(compare (:name %1) (:name %2)) people) 
;; -> ({:name "John", :role :reviewer} 


Ep {:name "Luke", :role :author} 

2 {:name "Meghan", :role :editor} 

Ee {:name "Ryan", :role :author} 

和 {:name "Tom", :role :reviewer} 

Ss {:name "Travis", :role :reviewer}) 


但 是 ， 还 有 更 容易 的 方法 。sort-by 函数 和 sort 的 工作 方式 相同 ， 但 接受 另 一 个 函数 
keyfn 作为 参数 ， 在 对 元 素 排序 之 前 应 用 于 元 素 。 它 不 是 按 元 素来 排序 ， 而 是 按 对 元 素 调 
用 keyfn 的 结果 来 排序 。 


所 以 ,将 :name 作为 keyfn 传 入 (正如 2.16 市 中 讨论 的 ， 关 键 字 作为 函数 ， 在 映射 表 中 查 
找 它们 自己 )， 可 以 调用 : 


























(sort-by :name people) 
;;-> ({:name "John", :role :reviewer} 
3 {:name "Luke", :role :author} 
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ye {:name "Meghan", :role :editor} 


2 {:name "Ryan", :role :author} 
i {:name "Tom", :role :reviewer} 
ep {:name "Travis", :role :reviewer}) 


像 sort 一 样 ，sort-by 也 接受 一 个 可 选 的 比较 函数 ， 用 于 比较 keyfn 提取 出 的 值 。 


男 一 个 例子 ， 下 面 的 表达 式 使 用 str 函数 作为 keyfn， 对 数字 1 至 20 进行 排序 ， 不 是 按照 
它们 的 数值 ， 而 是 按照 作为 字符 串 的 字典 顺序 (意味 着 “2” 大 于 “10”， 等 等 )。 它 也 展 
示 了 利用 定制 的 比较 方法 来 指定 结果 为 降序 : 

;; 降序 字典 序 


(sort-by str #(* -1 (compare %1 %2)) (range 1 20)) 
;; ->(98765432 19 18 17 16 15 14 13 12 11 10 1) 


数据 结构 的 自然 排序 

某 些 复合 数据 结构 ， 如 果实 现 了 Comparable 接口 ， 是 同样 的 类 型 ， 并 包含 可 比较 的 值 ， 也 
可 以 进行 比较 。 比 较 次 序 取决 于 实现 。 例 如 ， 默 认 情 况 下 ， 向 量 的 比较 是 先 比 较 长 度 ， 然 
后 对 第 一 个 值 应 用 compare， 如 果 第 一 个 值 相等 ， 再 看 第 二 个 值 ， 以 此 类 推 













































































(sort [[2 1] [1] [1 2] [1 1 1] [2]]) 
;; -> ([1] [2] [1 2] [2 1] [1 1 1]) 


某 些 数据 结构 是 不 可 比较 的 。 例 如 ， 集 按照 定义 是 无 序 的 ， 这 意味 着 一 般 不 可 能 得 到 有 意 
义 的 大 于 、 小 于 比较 ， 所 以 没有 提供 比较 方法 。 





参阅 

。 java.lang.Comparable 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/llang/Comparable. 
html) 。 

。 java.util.Comparator 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/uti/Comparator. 
html)。 

。 1.17 节 “ 模 糊 比 较 ”。 

。 1.29 节 “ 比 较 日 期 ”。 


2.25 ”从 集合 中 移 除 重复 元 素 


作者 : John Cromartie 





问题 
有 一 个 元 素 序列 ， 需 要 移 除 所 有 重复 元 素 ， 同 时 尽 可 能 保持 元 素 的 次 序 。 





[hdl 








解决 方案 
如 果 面 对 的 元 素 序列 是 有 界 的 ， 大 小 合适 ， 就 用 set 强制 将 集合 转换 成 散 列 集 ， 只 包含 不 
同 的 值 ， 

















(set [:a :a :g :a :b :9g]) 
;; -> #{:a :b :g} 





如 有 果 序 列 是 无 限 的 ， 或 者 需要 保持 次 序 ， 就 用 distinct 返回 一 个 惰性 序列 ， 它 包含 原 集合 
中 不 同 的 值 ， 保 持 出 现 的 次 序 : 














(distinct [:a :a :g :a :b :9g]) 
;; -> (:a :9g :b) 


讨论 

这 两 种 方法 之 间 有 一 些 折 中 考虑 。 例 如 ，set 利用 了 整个 序列 来 得 到 新 的 集 。 因 为 这 一 点 ， 
set 不 能 用 于 过 着 无 限 序列 。distinct 与 此 不 同 ， 它 是 为 惰性 序列 设计 的 。distinct 的 值 
是 另 一 个 序列 的 惰性 视图 或 投影 ， 元 素 第 一 次 出 现时 就 产生 新 值 : 




















(defn rand-int-seq 
"Returns an infinite sequence of ints from [0, n)" 
[n] 
(repeatedly #(rand-int n))) 

















;; 对 无 限 序列 应 用 set* 永远 不 会 * 返回 : 
;; (set (rand-int-seq 10)) ; 不 要 这 样 做 | 


;; 但 是 ， 如 果 限 制 了 序列 ，set 就 有 用 
(set (take 10 (rand-int-seq 10))) 
;; -> #{0 123478 9} 

















;; distinct 任何 情况 都 能 
(take 10 (distinct (rand-int-seq 10))) 
;; -> (8346059712) 











因为 distinct 在 看 到 新 值 时 产生 新 值 ， 所 以 它 确实 保持 了 原来 的 次 序 。set 不 是 这 样 ， 它 
返回 无 序 的 集 。 


如 果 distinct 又 有 序 ， 又 惰性 ， 又 适用 于 任何 长 度 ， 那 set 有 什么 好 处 ? 速度 。 使 用 
distinct 是 最 慢 的 选择 ， 简 单调 用 set 会 快 两 倍 。 



































参阅 
。 2.11 节 “ 创 建 集 ”。 
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2.26 ”检测 集合 是 否 包 含 几 个 值 中 的 一 个 


作者 : John Touron 


问题 
需要 确定 集合 是 否 包 含 儿 个 值 中 的 一 个 。 


解决 方案 
使 用 some， 带 一 个 集 : 


(some #{1 2} (range 10)) 


2 


(some #{10} (range 10)) 
;; -> nil 


讨论 
因为 集 可 以 用 作 函 数 ， 所 以 它们 可 以 用 作 谓 词 ， 测 试 参数 是 不 是 集 的 元 素 。 这 种 习惯 用 法 
将 测试 集合 中 的 每 个 元 素 ， 返 回 第 一 个 匹配 的 值 ， 如 果 没 有 匹配 ， 就 返回 niL。 但 是 ， 如 
果 nil 或 false 就 是 测试 集 的 成 员 ， 就 会 有 问题 。 考 虑 下 面 的 例子 ， 











(if (some #{nil} [1 2 nil 3]) 
::found 
: :Not-found) 

;; -> :User/not-found 


(if (some #{false} [1 2 false 3]) 
::found 
: :Not-found) 

;; -> :User/not-found 


因为 some 函数 返回 谓词 函数 的 返回 值 ， 而 不 是 true 或 fatse， 把 它 和 包含 nil 或 false 的 
集 一 起 使 用 ， 可 能 不 是 你 的 本 意 。 如 有 果 集 合 中 确实 有 nil 或 false， 它 会 返回 该 元 素 。 最 
简单 的 方法 就 是 单独 测试 nil 和 false， 利 用 Clojure 自 带 的 niL? 和 false? 谓词 函数 : 

















(if (some nil? [nil faLse]) 
: :found 
: :Not-found) 

;; -> :User/found 


(if (some false? [nil false]) 
: :found 
: :Not-found) 

;; -> :User/found 
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或 者 同时 测试 : 


(if (some #(or (false? %) 
(nil? %)) 
[nil false]) 
: :found 
: :Not-found) 
;; -> :User/found 


sh 
En 


。 2.13 方 “测试 集成 员 ”。 
。 2.16 节 “ 从 映射 表 中 取得 值 ”。 
si Dy 洲 
2.27 ”实现 定制 的 数据 结构 : 红 黑 树 〈 第 一 部 分 ) 
作者 : Leonardo Borges 
问题 
需要 在 Clojure 中 实现 一 个 有 明确 的 性 能 特点 的 数据 结构 。 
例如 ， 需 要 对 大 型 的 、 随 机 的 、 不 断 变化 的 数据 集 进 行 快速 高 效 的 内 存 查找 。 
解决 方案 


确定 Clojure 的 核心 数据 结构 不 适合 你 面 对 的 问题 之 后 ， 第 一 步 就 是 决定 什么 数据 结构 
适合 。 

















出 于 本 实例 的 目的 ， 假 定 需要 选择 并 实现 一 种 数据 结构 ， 能 快速 查找 内 存 中 大 型 的 、 随 
机 的 、 不 断 变 化 的 数据 集 。 首 先 ， 二 分 查找 树 (BST) 似乎 是 不 错 的 解决 方案 。 但 它 对 
排 好 序 的 数据 集 最 有 效 。 添 加 或 移 除 大 量 的 数据 会 让 BST 失衡 ， 让 它 的 性 能 退化 到 链表 
的 水 平 。 

















红 黑 树 (RBTs) 和 BSTs 类 似 ,但 是 能 自动 平衡 。 这 就 是 适合 该 问题 的 数据 结构 。 





下 一 步 就 是 实现 这 个 数据 结构 。RBT 的 实现 依赖 于 模式 匹配 。 使 用 core.match (https:// 
github.com/clojure/core.match) 来 简化 RBT 的 实现。 请 将 [org.clojure/core.match 
"0.2.0"] 加 入 项 目 依赖 关系 中 ， 或 用 Lein-try 开始 REPL: 


$ lein try org.clojure/core.match 


首先 ， 实 现 RBT 的 核心 ， 即 balance 和 insert-val 函数 。 利 用 core.match， 可 以 根据 树 
的 形状 ， 简 洁 地 表示 所 需 的 行为 : 
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(require '[clojure.core.match :refer [match]]) 


(defn balance 
"Ensures the given subtree stays balanced by rearranging black nodes 
that have at least one red child and one red grandchild" 
[tree] 
(match [tree] 
[(:or ;; 左 子 树 红 且 左 孙子 树 红 
[:black [:red [:redaxb]jyclzd] 
;; 左 子 树 红 且 右 孙 子 树 红 
[:black [:red a x [:red by cl]] zd] 
;; 右 子 树 红 且 左 孙子 树 红 
[:black a x [:red [:red byc]z d]] 
;; 右 子 树 红 且 右 孙子 树 红 
[:black a x [:red by [:red cz dl]]])] [:red [:black a x b] 








y 
[:black c z d]] 
:else tree)) 


(defn insert-val 
"Inserts x in tree. 
Returns a node with x and no children if tree is nil. 
Returned tree is balanced. See also “balance " 
[tree x] 
(let [ins (fn ins [tree] 
(match tree 
nil [:red nil x nil] 
[color a y b] (cond 
(< x y) (balance [color (ins a) y b]) 
(> x y) (balance [color ay (ins b)]) 
:else tree))) 
[_ ay b] (ins tree)] 
[:black a y b])) 





有 了 插入 和 平衡 ， 只 剩 下 find-val 函数 要 实现 了 ， 它 检查 值 是 否 在 RBT 中 。 最 容易 的 方 
法 就 是 用 match 来 分 解 单 个 树 结 点 ， 并 递归 地 寻找 期 望 的 值 : 











(defn find-val 
"Finds vaLue x in tree" 


[tree x] 
(match tree 
nil nil 


[_ ayb] (cond 
(< x y) (recur a x) 
(> x y) (recur b x) 
:else x))) 


一 切 就 续 之 后 ， 就 可 以 创建 并 查询 RBT 了 : 
(def rb-tree (reduce insert-val nil (range 4))) 


rb-tree 





大 
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;; -> [:black [:black nil 0 nil] 1 [:black nil 2 [:red nil 3 nil]]] 


(find-val rb-tree 2) 
;; ->2 


(find-val rb-tree 100) 

;; -> Nil 
讨论 
对 于 实现 过 红 黑 树 ， 或 者 上 过 计算 机 科学 课程 、 学 过 算法 的 人 来 说 ，balance 的 实现 似乎 
极其 简单 。 原 因 有 以 下 三 点 。 


。 我 们 的 红 黑 树 是 稳定 持续 的 ， 对 它 的 操作 ， 诸 如 插入 和 平衡 ， 不 会 破坏 它 。 
。 Balance 和 find-val 利用 了 core.match， 将 逻辑 编写 为 模式 匹配 。 

。 市 点 表示 为 癌 量 。 

你 很 快 会 看 到 ， 后 两 点 是 相关 的 。 


core.match 让 我 们 能 匹配 数据 结构 的 形状 和 值 ， 同 时 执行 结构 绑 定 ， 这 非常 方便 。 例 如 ， 
下 面试 图 用 两 个 子 句 来 匹配 a-vector: 









































台 











(def a-vector [1 2 3]) 


(match a-vector 
[_ y] (str "Got y: " y) 
[_ _z] (str "Got z: " z)) 
;; -> "Got z: 3" 








第 一 个 子 句 匹 配 两 个 元 素 的 向 量 ， 第 二 个 子 句 匹配 三 个 元 素 的 向 量 。 由 于 a-vector 正好 有 
三 个 元 素 ， 它 匹配 了 第 二 个 子 句 。 在 紧 接着 的 表达 式 中 ， 命 名 的 值 (如 z) 绑 定 到 它们 匹 
配 的 位 置 。 


这 就 是 用 向 量 来 表示 节点 很 方便 的 原因 ， 对 它们 进行 模式 匹配 毫 不 费力 : 





(def rb-node [:red nil 3 [:black nil 4 nil]]) 


(match rb-node 
[:red Left value right] (str "Red node with value: " value) 
[:black Left vaLue right] (str "Black node with vaLue: " value)) 
;; -> "Red node with vaLue: 3" 


假定 这 个 新 的 定制 数据 结构 能 满足 性 能 标准 ， 接 下 来 做 什么 ?” (你 打算 对 所 有 定制 的 数据 
结构 跑 个 基准 济 试 ， 对 吗 ?) 与 内 建 的 数据 结构 不 同 ， 这 个 定制 的 数据 结构 不 支持 map 和 
fitter 这 样 的 核心 函数 。 


在 本 实例 的 第 二 部 分 ， 即 2.28 市 ， 我 们 将 改变 这 种 状况 ， 加 入 核心 序列 抽象 。 
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参阅 

。 本 实例 的 第 二 部 分 ，2.28 节 “ 实 现 定制 的 数据 结构 : 红 黑 树 (第 二 部 分 )”， 我 们 为 

RBT 添加 了 序列 功能 。 

维基 百科 上 的 红 黑 树 (http://en.wikipedia.org/wiki/Red%E2%809%93black_tree) 以 更 传统 

的 方式 探讨 了 这 种 有 趣 的 数据 结构 。 

。 对 于 本 实例 中 的 函数 式 方法 ，Chris Okasaki 的 著作 Purely Functional Data Structures 
(http://www.amazon.com/Purely-Functional-Structures-Chris-Okasaki/dp/0521663504, 
Cambridge University Press) 提供 了 很 好 的 说 明 。 该 书 探讨 如 何在 函数 式 环境 中 高 效 地 实 
现 数据 结构 。 作 者 选择 使 用 ML 和 Haskell, 但 概念 也 适合 Clojure ,就 像 前 面 描述 的 那样 。 


2.28 ”实现 定制 的 数据 结构 : 红 黑 树 〈 第 二 部 分 ) 


作者 : Ryan Neufeld， 最 初 由 Leonardo Borges 提交 





二 























问题 
需要 对 定制 的 数据 结构 使 用 Clojure 的 核心 序列 函数 (conj、map、filter 等 ) 。 
解决 方案 


本 实例 的 第 一 部 分 实现 了 创建 高 效 的 红 墨 树 所 需 的 全 部 函数 。 缺 失 的 部 分 是 参与 Clojure 
的 序列 抽象 。 


要 参与 序列 抽象 ， 最 重要 的 一 点 是 能 够 以 序列 的 方式 提供 数据 结构 的 值 。 内 建 的 tree-seq 
很 适合 这 个 任务 。 但 还 需要 一 个 步骤 ， 因 为 tree-seq 返回 节点 的 序列 ， 而 不 是 值 的 序列 。 








下 面 是 最 终 的 rb-tree->seq 国 数 ; 











(defn- rb-tree->tree-seq 
"Return a seq of all nodes in an red-black tree." 
[rb-treel] 
(tree-seq sequential? (fn [[_ left _ right]] 
(remove nil? [left right])) 
rb-tree)) 


(defn rb-tree->seq 
"Convert a red-black tree to a seq of its values." 
[rb-treel] 
(map (fn [[. _ val _]] val) (rb-tree->tree-seq rb-tree))) 


(rb-tree->seq (-> nil 
(insert-val 5) 
(insert-val 2))) 
;; -> (5 2) 
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既然 RBT 最 像 集 ， 那 就 应 该 适应 PersistentSet 接口 。 扩 展 IPersistentSet 和 IFn 协 
议 ， 成 为 新 的 RedBLackTree 类 型 ， 实 现 所 有 必要 的 国 数 。 为 RedBLackTree 实现 多 重 方法 
print-method 也 是 个 好 主意 ， 因 为 对 于 RedBLackTree 来 说 ， 默 认 实 现 会 失效 ， 


(deftype RedBLackTree [tree] 
clojure. lang.IPersistentSet 
(cons [self v] (RedBlackTree. (insert-val tree v))) 
(empty [self] (RedBlackTree. nil)) 
(equiv [self o] (if (instance? RedBLackTree 0o) 
(= tree (.tree 0)) 
false)) 
(seq [this] (if tree (rb-tree->seq tree))) 
(get [this n] (find-val tree n)) 
(contains [this n] (boolean (get this n))) 
;; (disjoin [this n] ...) ;; 因为 复杂 而 省 略 
clojure. lang.IFn 
(invoke [this n] (get this n)) 
Object 
(toString [this] (pr-str this))) 
(defmethod print-method RedBLackTree [o ^java.io.Writer w] 
(.write w (str "#rbt " (pr-str (.tree 0))))) 





disjoin 和 对 应 的 remove-val 函数 留 给 读者 作为 练习 。 





现在 可 以 像 其 他 集合 一 样 使 用 RedBlackTree 实例 了 ， 特 别 是 ， 它 的 实例 就 像 集 一 样 。 


(into (->RedBlackTree nil) (range 2)) 
;; -> #rbt [:black nil 0 [:red nil 1 nil]] 


(def to-ten (into (->RedBlackTree nil) (range 10))) 


(seq to-ten) 
;; ->(310254768 9) 


(get to-ten 9) 
;; ->9 


(contains? to-ten 9) 
;; -> true 


(to-ten 9) 
;; ->9 


(map inc to-ten) 
;; -> (421365879 10) 
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， 加 入 序列 抽象 没有 太 多 工作 量 。 通 过 实现 少数 几 个 接口 函数 ，2.27 市 中 的 红 黑 树 实 
现 就 能 参与 一 系列 面向 序列 的 函数 : map、filter、reduce…… 只 要 你 说 得 出 来 。 


本 质 上 ，clojure.lang.IPersistentSet 是 一 种 抽象 ， 代 表 数 学 上 的 集 ， 这 很 符合 树 这 种 数 
据 结 构 。 但 集 不 是 列表 或 序列 。 那 为 什么 说 RedBlackTree 参与 序列 抽象 呢 ? 


在 Clojure 中 ,扩展 clojure.lang.ISeq 接口 的 类 型 是 真正 的 序列 ， 表 示 由 头 和 尾 组 成 的 逻 
辑 列表 。 虽 然 IPersistentSet 不 是 继承 自 I Seq， 但 它们 确实 有 共同 的 祖先 。 这 两 个 接口 都 
扩展 了 clojure.lang.IPersistentCollection 及 其 父 接口 clojure.lang.Seqable。 幸 运 的 
是 ,序列 函数 依赖 于 集合 的 Seqable 接口 ,而 不 是 ISeq 接口 。 既 然 RedBlackTree 可 以 被 当 
成 序列 读 入 ， 它 就 是 Seqable 的 ， 能 被 你 熟悉 和 喜爱 的 所 有 序列 函数 操作 。 


IPersistentSet 接口 中 的 大 多 数 函 数 都 是 无 需 解释 的 ， 但 有 一 些 值得 进一步 解释 。 函 数 
cons 是 一 个 历史 名 称 ， 它 通过 向 原 有 的 列表 添加 一 个 值 而 得 到 新 列表 。seq 的 作用 是 从 集 
合 得 到 序列 ， 如 果 是 空 集 就 返回 ntl 








一 












































JPersistentSet.java: 
public interface IPersistentSet extends IPersistentCollection, Counted { 
public IPersistentSet disjoin(Object key); 
public boolean contains(Object key); 
public Object get(Object key); 
} 


IPersistentCollection.java: 


public interface IPersistentCollection extends Seqable { 
int count(); 
IPersistentCollection cons(Object o); 
IPersistentCollection empty(); 
boolean equiv(Object 0); 


} 


Seqable.java: 


public interface Seqable { 
ISeq seq(); 
} 


在 所 有 Seqable 的 实现 中 ， 最 有 挑战 的 部 分 实际 上 是 从 底层 的 数据 结构 中 得 到 一 个 序列 。 
如 果 需 要 编写 自己 的 惰性 树 遍历 算法 ， 难 度 就 更 大 了 。 但 幸运 的 是 Clojure 有 内 建 的 函数 
tree-seq， 就 是 用 来 完成 这 个 任务 的 。 利 用 tree-seq 来 生成 节点 的 序列 ， 编 写 rb-tree- 
>seq 转换 函数 很 简单 ， 它 实现 了 RedBlackTree 的 惰性 遍历 ， 在 遍历 时 得 到 节点 的 值 。 


























注 1: 实际 上 ， 要 感谢 设计 者 。 
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tree-seq 接受 三 个 参数 。 


branch? 
这 是 一 个 条 件 ， 在 节点 是 枝 〈 不 是 叶 节 点 ) 时 返回 true。 对 于 RedBLackTree 来 说 ， 
sequential? 检查 就 足够 了 ， 因 为 每 个 节点 都 是 一 个 向 量 。 








children 


这 是 一 个 函数 ， 返 回 给 定 节 点 的 所 有 子 市 


root 


遍历 开始 的 节点 。 








tree-seq 执行 深度 优先 遍历 。 根 据 红 黑 树 的 表示 方式 ， 这 不 是 排序 的 遍历 





有 了 序列 转换 函数 ， 很 容易 编写 seq 国 数 。 类 似 地 ， 编 写 cons 和 empty 也 不 费事 ， 只 要 利 
用 已 有 的 树 函 数 。 但 相等 测试 可 能 有 点 难 。 





简单 起 见 ， 我 们 选择 只 在 RedBLackTree 实例 之 间 实 现 相 等 判断 (equiv)。 而 且 ， 该 实现 
enh 列 。 在 这 种 情况 下 ，equiv 回答 的 问题 是 “这 些 树 拥有 同样 的 值 
吗 ? ”而 不 是 “它们 是 同样 的 树 吗 ? ”这 种 区 别 很 重要 ， 在 实现 自己 的 数据 结构 时 需要 仔 
细 考 虑 。 


2.26 市 讨论 到 ， 集 有 一 大 好 处 ， 它 能 像 其 他 函数 一 样 调 用 。 为 RedBlackTree 提供 这 样 的 能 
力也 很 容易 。 通 过 实现 clojure.lang.IFn 接口 的 单 参数 函数 invoke，RedBlackTree 就 能 像 
其 他 函数 一 样 调用 (或 者 说 ， 像 集 一 样 调用 ) : 











(some (rbt [2 3 5 7]) [6]) 
; -> nil 


((rbt (range 10)) 3) 

;; -> 3 
即使 完全 实现 了 IPersistentSet 接口 ，RedBLackTree 还 是 有 一 些 不 方便 。 例 如 ， 需 要 使 用 
韭 专门 设计 的 / 一 Red BlackTree 或 RedBLackTree. 国 数 来 创建 新 的 RedBLackTree， 然 后 再 
手工 添加 值 。 按 照 传统 ， 许 多 内 建 的 集合 都 提供 便捷 的 方法 来 填充 它们 (更 不 必 说 像 品 或 
{} 这 样 的 字面 值 标签 了 ) 。 





很 容易 让 RedBLackTree 模仿 vec 和 vector : 


(defn rbt 
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"Create a new RedBLackTree with the contents of coll." 
[coll] 
(into (->RedBlackTree nil) coll)) 


(defn red-black-tree 
"Creates a new RedBlackTree containing the args." 
[& args] 
(rbt args)) 


(rbt (range 3)) 
;; -> #rbt [:black [:black nil 0 nil] 1 [:black nil 2 nil]] 


(red-black-tree 7 42) 

;; -> #rbt [:black nil 7 [:red nil 42 nil]] 
你 也 许 会 注意 到 ， 打 印 不 是 序列 抽象 考虑 的 事 ， 虽 然 对 于 开发 用 户 友 好 和 机 器 友好 的 数据 
结构 来 说 ， 这 肯定 是 考虑 的 重点 。 在 Clojure 中 有 两 种 类 型 的 打印 : toString 和 基于 pr 的 
打印 。tostring 图 数 是 为 了 在 REPL 中 打印 人 可 读 的 值 ， 而 pr 系列 的 函数 或 多 或 少 是 为 
了 打印 Clojure 读 取 程序 可 读 的 值 。 





要 提供 自己 可 读 的 RBT 表示 形式 ， 必 须 为 RedBtackTree 实现 print-method (pr 的 核心 )。 
通过 写成 “ 带 标 签 的 字面 值 ”格式 (如 #rbt)， 就 可 以 配置 读 取 程序 ， 将 写 下 的 值 吸收 并 
合成 为 一 等 对 象 


(require '[clojure.edn :as edn]) 


;; Recall ... 
(defmethod print-method RedBlackTree [o ^java.io.Writer w] 
(.write w (str "#rbt " (pr-str (.tree 0))))) 


(def rbt-string (pr-str (rbt [1 4 2]))) 
rbt-string 

;; -> "#rbt [:black [:black nil 1 nil] 2 [:black nil 4 niL]]" 
(edn/read-string rbt-string) 

;; -> RuntimeException No reader function for tag rbt ... 


(edn/read-string {:readers {'rbt ->RedBlackTree}} 
rbt-string) 
;; -> #rbt [:black [:black nil 1 nil] 2 [:black nil 4 nil]] 


sh 


阅 

本 实例 的 第 一 部 分 (2.27 节 “ 实 现 定制 的 数据 结构 : 红 黑 树 (第 一 部 分 )”)， 其 中 定义 
了 最 初 的 红 黑 树 实现 。 

。 4.14 节 “ 读 写 Clojure 数据 ”， 以 及 4.17 节 “ 读 取 Clojure 数据 时 处 理 未 知 的 带 标 签字 
面值 ” ， 其 中 探讨 了 有 关 读 取 Clojure 数据 的 更 多 内 容 。 












































3.0 简介 


商业 中 有 名 名 言 : 没有 哪个 组 织 机 构 运 行 在 理想 环境 中 。 这 也 适用 于 Clojure。 虽 然 
Clojure 提供 了 各 种 高 效 的 工具 和 技术 ， 但 还 是 有 一 些 活 动 和 技术 ， 出 于 某 些 原因 ， 疫 能 在 
软件 中 提供 。 有 人 称 之 为 学 术 特 质 ， 或 偶然 的 复杂 性 ， 但 我 们 更 愿意 称 之 为 生活 的 现实 。 





本 章 探讨 了 一 些 Clojure 开发 的 主题 ， 它 们 不 太 适 合 独立 成 章 。 比 如 说 : 





。 如 何 利 用 Clojure 的 开发 生态 系统 ? 

。 抽象 概念 例如 多 态 ) 如 何 应 用 于 Clojure ? 

。 什么 是 逻辑 编程 ， 何 时 会 用 到 它 ? 

3.1 运行 最 小 的 Clojure REPL 


作者 : John Cromartie 





问题 
在 不 装 额外 的 工具 的 情况 下 ， 运 行 Clojure REPL。 
解决 方案 


从 http://clojure.org/downloads 下 载 并 解压 发 行 版 ， 得 到 Clojure 的 Java 包 (JAR)。 利 用 终 
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端 ， 进 入 到 解压 JAR 的 目录 ， 然 后 开始 Clojure REPL : 


$ java -cp "clojure-1.5.1.jar" clojure.main 





现在 运行 的 就 是 交互 式 Clojure REPL (“ 读 取 、 求 值 、 打 印 ” 循 环 ) 。 输 入 表达 式 并 回 车 ， 
就 能 得 到 表达 式 的 值 。 按 CtrlL-D 退出 。 























讨论 
事实 上 ，JVM 上 的 Clojure 封装 在 一 个 JAR 文件 中 ， 这 样 做 有 很 多 的 好 处 。 一 个 好 处 就 
是 ， 这 意味 着 Clojure 从 未 真正 安装 。 它 只 是 一 种 依赖 关系 ， 像 其 他 所 有 的 Java 库 一 样 。 
禁 换 掉 一 个 文件 ， 就 可 以 容易 地 更 换 Clojure 的 版 本 。 




















我 们 分 析 一 下 这 里 的 java 调用 。 首 先 ， 设置 了 Java 的 类 路 径 ， 包 含 Clojure (在 这 个 例子 
中 ， 只 包含 Clojure) : 








-Cp "clojure-1.5.1.jar" 











全 面 解释 类 路 径 超 出 了 本 实例 的 讨论 范围 ， 只 要 知道 它 是 一 个 位 置 列 表 ，Java 将 在 这 些 
位 置 寻找 并 加 载 类 。JVM 类 路 径 的 全 面 讨论 可 以 参考 http://docs.oracle.com/javase/tutorial/ 
essential/environment/paths.html。 在 命令 行 的 最 后 部 分 ， 我 们 指定 了 Java 应 该 加 载 的 类 ， 
并 执行 其 main 方法 : 


























clojure.main 


是 的 ，clojure.main 确实 是 一 个 Java 类 。 它 看 起 来 不 像 是 典型 的 Java 调用 ， 这 是 因为 
Clojure 的 命名 空间 ， 它 们 会 被 编译 成 类 ， 但 不 像 Java 类 那样 ， 习 惯 使 用 大 写 开头 的 名 字 。 





是 最 小 的 Clojure 环境 ， 也 是 在 安装 了 Java 的 系统 上 上， 运行 Clojure 所 需 的 全 部 内 
容 。 当 然 ， 对 于 日 常 使 用 和 开发 ， 几 乎 肯定 需要 功能 更 丰富 的 解决 方案 ， 比 如 Leiningen。 


但 在 某 些 情况 下 ， 手 工 调整 的 Java 调用 可 能 是 在 环境 中 集成 Clojure 的 最 佳 方式 。 在 服务 
器 上 部 署 一 个 JAR 文件 很 容易 ， 不 用 安装 更 复杂 的 包 ， 这 一 点 尤其 重要 。 





+ 
虑 
池 











。 Leiningen 网 站 (http:Wleiningen.org/) 。 
。 3.6 三 “从 命令 行 运行 程序 ”。 


3.2 ”交互 式 文档 


作者 : John Cromartie 





A 
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问题 
在 REPL 时 ， 和 希望 阅读 国 数 文档 。 


解决 方案 


在 REPL 中 ， 用 doc 安打 印 国 数 文档 : 








User=> (doc conj) 
clojure.core/conj 
([coll x] [coll x & xs]) 
conj[oin]. Returns a new collection with the xs 
'added'. (conj nil item) returns (item). The 'addition' may 
happen at different 'places' depending on the concrete type. 


在 REPL 中 ， 用 source 宏 打 印 函 数 源 代码 : 





User=> (source reverse) 
(defn reverse 
"Returns a seq of the items in coll in reverse order. Not lazy. 


{:added "1.0" 
:static true} 
[coll] 


(reducel conj () coll)) 


用 find-doc 找到 文档 匹配 给 定 正则 表达 式 的 函数 : 








user=> (find-doc #"defmacro") 
clojure.core/definline 
([name & decL]) 
Macro 
Experimental - like defmacro, except defines a named function whose 
body is the expansion, calls to which may be expanded inline as if 
it were a macro. Cannot be used with variadic (&) args. 
clojure.core/defmacro 
([name doc-string? attr-map? [params*] body] 
[name doc-string? attr-map? ([params*] body) + attr-map?]) 
Macro 
Like defn, but the resulting function name is declared as a 
macro and will be used as a macro by the compiler when it is 
called. 


讨论 
Clojure 支持 在 线 函 数 文档 〈 稍 后 详 述 ) ， 以 及 其 他 元 数据 ， 让 开发 者 可 以 在 任何 时 候 查看 
文档 等 内 容 。doc 和 source 宏 只 是 REPL 中 方便 的 函数 。 
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le Clojure 的 所 有 内 部 机 制 。 如 果 你 没有 这 样 做 过 ， 下 面 的 例子 
能 让 你 感到 震撼 : 


User=> (source source) 

(defmacro source 
"Prints the source code for the given symbol, if it can find it. 
This requires that the symbol resolve to a Var defined in a 
namespace for which the .clj is in the classpath. 


Example: (source filter)" 

[n] 

‘(println (or (source-fn '~n) (str "Source not found")))) 
如 果 知 道 source 定义 在 clojure.repl 命名 空间 中 ， 通 过 对 (source clojure.repl/source- 
fn) 求 值 ， 就 可 以 看 到 它 到 底 如 何 取 得 源 代码 。 

















在 大 多 数 REPL 实现 中 ， 像 source 和 doc 这 样 的 clojure.repl 宏 只 是 引用 到 user 命名 空 
间 。 这 意味 着 只 要 切换 到 另 一 个 命名 空间 ， 未 加 限定 的 clojure.repl 宏 就 不 能 访问 了 。 可 
以 为 宏 提 供 命名 空间 来 绕 过 这 个 问题 (用 clojure.repl/doc， 而 不 是 doc)， 或 者 通过 use 
那个 命名 空间 ， 进 行 扩展 应 用 : 





User=> (ns foo) 

foo=> (doc +) 

CompilerException java.lang.RuntimeException: Unable to resolve symbol: doc 
in this context, compiling:(NO_SOURCE_PATH:1:1) 


foo=> (use 'clojure.repl) 
nil 


foo=> (doc +) 


clojure.core/+ 


([] [x] [x y] [x y & more]) 
Returns the sum of nums。 (+) returns 0. Does not auto-promote 
longs, will throw on overflow. See also: +' 


用 这 种 方式 探索 Clojure， 是 学 习 核 心 国 数 和 高 级 Clojure 编程 技术 的 极 好 方法 。clojure. 
core 命名 空间 充满 了 唾 手 可 得 的 高 质量 、 高 性 能 的 代码 。 








参阅 
。 clojure.repl 的 API 文档 (http://clojure.github.io/clojure/clojure.repl-api.html)。 
。 3.3 节 “ 探 索 命 名 空间 ”。 


3.3 ”探索 命名 空间 


作者 : John Cromartie 
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道 加 载 了 哪些 命名 空间 ， 它 们 有 哪些 公有 的 var 可 以 访问 。 


解决 方案 


用 Loaded-Libs 获取 当前 加 载 的 命名 空间 集 。 例 如 ， 在 REPL 中 : 








‘user=> (pprint (Loaded-Libs)) 

#{clojure.core.protocols clojure.instant clojure.java.browse 
clojure.java.io clojure.java.javadoc clojure.java.shell clojure.main 
clojure.pprint clojure.repl clojure.string clojure.uuid clojure.walk} 


用 dir 打印 命名 空间 中 的 公有 var: 


User=> (dir clojure.instant) 
parse-timestamp 
read-instant-calendar 
read-instant-date 
read-instant-timestamp 
validated 


用 ns-publics 获取 命名 空间 中 符号 到 公有 var 的 映射 : 


(ns-publics 'clojure.instant) 
;; -> {read-instant-calendar #'clojure.instant/read-instant-calendar, 


BI read-instant-timestamp #'clojure.instant/read-instant-timestamp, 
a validated #'clojure.instant/validated, 
read-instant-date #'clojure.instant/read-instant-date, 
Ed parse-timestamp #'clojure.instant/parse-timestamp} 
BS VAN 
讨论 


Clojure 中 的 命名 空间 是 符号 到 var 的 动态 映射 。 命 名 空间 是 不 可 访问 的 ， 除 非 它 被 引 
和 入。 例如， 在 开始 REPL 或 在 ns 声明 中 作为 依赖 关系 时 。 只 有 在 运行 时 ， 才 知道 可 用 的 
Clojure 库 和 命名 空间 ， 这 和 典型 的 Java 开发 不 同 (关于 包 的 几乎 所 有 信息 在 编译 时 就 知 
道 了 )。 


动态 本 质 的 缺点 是 ， 必 须知 道 要 加 载 哪些 命名 空间 ， 才 能 探索 它们 。 








参阅 
。 clojure.repl API 文 档 (http:Wclojure.github.io/clojure/clojure.repl-api.html) 。 
。 3.2 节 “ 交 互 式 文档 。 
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3.4 ”尝试 库 而 不 指明 依赖 关系 


作者 : Mark Whelan 


问题 
希望 在 REPL 中 尝试 一 个 库 ， 而 不 必修 改 项 目的 依赖 关系 或 创建 新 项 目 。 


解决 方案 


用 Ryan Neufeld 的 Lein-try 来 发 起 REPL。 库 依赖 关系 将 自动 满足 。 











要 获得 这 种 能 力 ， 首 先 要 确保 使 用 Leiningen 2.1.3 或 更 新 的 版 本 。 然 后 编辑 ~/.lein/profiles. 
clj 文件， 将 [lein-try "0.4.1"] 添加 到 :user 特性 描述 的 :plugins 向 量 中 : 





{:user {:plugins [[lein-try "0.4.1"]]}} 


接 下 来 就 可 以 用 你 选择 的 库 ， 体 验 儿 乎 马上 到 来 的 满足 感 了 : 





$ lein try clj-time 
Retrieving clj-time/clj-time/0.6.0/clj-time-0.6.0.pom from clojars 
Retrieving clj-time/clj-time/0.6.0/clj-time-0.6.0.jar from clojars 
NREPL server started on port 58981 on host 127.0.0.1 
REPL-y 0.2.1 
Clojure 1.5.1 

Docs: (doc function-name-here) 

(find-doc "part-of -name-here") 
Source: (source function-name-here) 

Javadoc: (javadoc java-object-or-class-here) 

Exit: Control+D or (exit) or (quit) 


























er 
讨论 
注意 ， 没 必要 给 例子 中 的 库 指定 版 本 号 。lein-try 将 自动 抓 取 最 新 发 布 的 版 本 。 
当然 ， 如 果 愿 意 ， 也 可 以 指定 库 的 版 本 。 在 库 名 后 添加 版 本 号 就 可 以 了 : 

$ lein try clj-time 0.5.1 

es 





要 快速 了 解 用 法 选项 ， 就 用 lein help try: 


$ lein help try 
Launch REPL with specified dependencies available. 
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Usage : 
lein try [io.rkn/conformity "0.2.1"] [com.datomic/datomic-free "0.8.4020.26"] 
lein try io.rkn/conformity 0.2.1 
lein try io.rkn/conformity # This uses the most recent version 


NOTE: lein-try does not require [] 


Arguments: ([& args]) 


作为 一 个 Clojure 工具 ，lein-try 提供 了 一 种 让 任务 更 易 完 成 的 优雅 的 方法 。 根 据 你 的 喜 
好 ， 用 它 从 网 上 下 载 那 些 功 能 强大 的 库 ， 不 需要 设置 它们 ， 有 瞬间 就 可 以 获得 新 的 能 力 ， 享 
受 魔法 般 的 满足 感 。 








参阅 
。 Leiningen 插件 的 官方 例 表 (https://github.com/technomancy/leiningen/wiki/Plugins)。 
。 前 言 中 的 “我 们 的 金 童 lein-try”。 


3.5 ”运行 Clojure 程 序 


作者 : John Cromartie 


希望 通过 Clojure 源 代 码 ， 运 行 有 单个 入 口 点 的 程 


解决 方案 


要 运行 全 是 Clojure 表达 式 的 文件 ， 只 需 将 它 的 文件 名 作为 参数 传递 给 clojure.main。 


起 











为 了 继续 这 个 实例 ， 可 以 从 http://clojure.org/downloads 下 载 clojure.jar。 





例如 ， 若 文件 my_clojure_program.clj 中 包含 内 容 : 
(println "Hi.") 
调用 java 命令 ， 以 my_clojure_program.clj 作为 最 后 的 参数 : 


$ java -cp clojure.jar clojure.main my_clojure_program.clj 
Hi. 





在 更 结构 化 的 项 目 中 ， 可 能 有 一 些 文件 组 织 在 src/ 目录 下 。 例 如 ， 给 定 文件 src/com/ 
example/my_program.clj: 
(ns com.example.my-program) 


(defn -main [& args] 
(println "Hey!")) 


要 加 载 并 运行 -main 函数 ， 就 用 -m/--maiin 选项 指定 期 望 的 命名 空间 ， 并 把 src 加 入 到 类 路 
径 中 (通过 -cp) 


$ java -cp clojure.jar:src clojure.main --main com.example.my-program 
Hey! 


讨论 

尽管 你 会 花 许多 的 时 间 在 REPL 中 对 Clojure 代码 求 值 ， 但 有 时 候 也 需要 能 够 运行 一 个 
简单 的 “脚本 ”， 其 中 都 是 Clojure 表达 式 ， 或 者 运行 带 有 -main 入 口 点 的 、 更 结构 化 的 
Clojure 应 用 。 




















不 管 哪 种 情况 ， 都 可 以 访问 在 脚本 名 后 面 传人 的 其 他 命令 行 参数 ， 或 是 主 命名 空间 的 
名 称 。 


例如 ， 假 定 有 以 下 程序 ， 放 在 名 为 hello.clj 的 文件 中 : 

















(defn greet 
[name] 
(str "Hello, " name "!")) 


(doseq [name *command-line-args*] 
(println (greet name))) 


直接 调用 这 个 Clojure 程序 ， 将 得 到 预期 的 输出 : 
$ java -cp clojure.jar clojure.main hello.clj Alice Bob 


Hello, Alice! 
Hello, Bob! 


这 个 简单 的 脚本 有 副作用 ， 它 在 加 载 的 时 候 打 印 输 出 。 大 多 数 Clojure 代码 不 是 以 这 种 方 
式 组 织 的 。 

因为 通常 总 是 希望 将 代码 放 在 组 织 良 好 的 命名 空间 中 ， 所 以 可 以 用 一 个 -main 函数 ， 为 命 
名 空间 提供 一 个 入 口 点 。 这 样 就 能 避 开 加 载 时 的 副作用 ， 其 至 可 以 在 REPL 中 调整 并 调用 
-main 函数 ， 就 像 交 互 式 开发 时 的 所 有 其 他 函数 一 样 。 


假定 将 国 数 greet 移 至 foo.util 命名 空间 ， 项 目的 结构 变 成 如 下 的 样子 : 


























-A 
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./src/foo/util.clj 
./src/foo.clj 











foo 命名 空间 引入 foo.util 命名 空间 ， 并 提供 -main 函数 ， 像 这 样 : 








(ns foo 
(:require foo.util)) 


(defn -main 
[& args] 
(doseq [name args] 
(println (foo.util/greet name)))) 


如 果 调 用 Clojure 时 以 foo 作为 “ 主 ” 命 名 空间 ， 它 将 调用 -main 函数 ， 并 带 上 提供 的 命令 


行 参数 : 


$ java -cp clojure.jar:src clojure.main --main foo Alice Bob 
Hello, Alice! 
Hello, Bob! 


你 也 注意 到 ，-cp 选项 后 添加 了 :src。 这 告诉 Java， 执 行 时 的 类 路 径 不 仅 包括 clojure.jar， 


也 包括 src/ 目录 下 的 内 容 。 


参阅 
。 3.6 节 “ 从 命令 行 运行 程序 ”， 学 习 如 何 从 命令 行 运 行 Leiningen 项 目 。 
。 3.7 节 “ 解 析 命令 行 参数 "， 学 习 如 何在 命令 行 应 用 中 提供 多 个 选项 和 标志 。 


3.6 ”从 命令 行 运行 程序 


作者 : Ryan Neufeld 

















希望 从 命令 行 启动 Clojure 应 用 。 


解决 方案 





对 于 所 有 Leiningen 项 目 ， 用 Lein run 命令 从 命令 行 启动 应 用 。 要 继续 这 个 实例 ， 先 创建 


一 个 新 的 Leiningen 项 目 : 


$ lein new my-cli 





全 





在 项 目的 project.clj 文件 中 ， 添 加 :main 键 ， 配 置 作为 应 用 入 口 点 的 命名 空间 : 





(defproject my-cli "0.1.0-SNAPSHOT" 
:description "FIXME: write description" 
:url "http://example.com/FIXME" 
:license {:name "Eclipse Public License" 
:url "http://www.eclipse.org/legal/epl-v10.html"} 
:dependencies [[org.clojure/clojure "1.5.1"]] 
:main my-cli.core) 


最 后 ， 为 project.clj 中 配置 的 命名 空间 添加 -main 函数 : 
(ns my-cli.core) 


(defn -main [& args] 
(println "My CLI received arguments:" args)) 


现在 ， 用 Lein run 来 运行 应 用 : 


$ lein run 
My CLI received arguments: nil 


$ lein run 1 :foo "bar" 
My CLI received arguments: (1 :foo bar) 


讨论 

事实 证 明 ， 从 命令 行 启动 应 用 更 容易 。Leiningen 的 run 命令 快速 而 方便 地 将 应 用 与 命令 行 
联系 起 来 ， 没 有 不 必要 的 麻烦 。 在 其 基本 形式 中 ， 无 论 项 目的 project.clj 文件 中 
名 空间 指定 为 :main，lein run 都 将 调用 它 的 -main 函数 。 例 如 ， 设 置 :main my-cli.core 
都 将 会 调用 my-cli.core/-main。 或 者 ， 也 可 以 不 实现 -main， 而 在 :main 中 指定 带 完整 命 
名 空间 限定 的 函数 (如 my.cli.core/alt-main)， 这 个 函数 将 末代 -main 被 调用 。 











在 前 面 的 解决 方案 中 ， 虽 然 打 印 出 来 的 参数 看 起 来 像 是 Clojure 数据 ， 但 它们 实际 上 是 
普通 字符 串 。 对 于 简单 的 参数 ， 你 可 能 选择 自己 来 解析 这 些 字符 串 ， 或 者 ， 我 们 建议 使 
用 tools.cli 库 (https://github.com/clojure/tools.cli)。 关 于 tootLs.ctLi 的 更 多 内 容 ， 参 见 
3 























尽管 项 目 只 能 有 一 个 默认 的 :main 入 口 点 ,但 也 可 以 在 命令 行 中 设置 -m 选项 ， 指 向 命名 空 
间或 函数 ， 从 而 启动 其 他 函数 。 如 果 将 -m 设 置 为 命名 空间 (如 my-cli.core)， 该 命名 空 
间 的 -main 函数 就 会 被 调用 。 如 果 将 -m 设置 为 函数 的 全 名 (如 my-cli.core/alt-main) 则 
该 函数 将 被 调用 。 这 个 函数 不 需要 带 “-” 前 级 (表明 它 是 一 个 Java 方法)， 它 只 是 必须 接 
受 可 变数 量 的 参数 就 像 -main 通常 那样 )。 






































例如 ， 可 以 在 my.cli/core 中 添加 add-main 函数 ; 


(ns my-cli.core) 





(defn -main [& args] 
(println "My CLI received arguments:' 


args)) 


(defn add-main [& args] 
(->> (map #(Integer/parseInt %) args) 
(reduce + 0) 
(println "The sum is:"))) 


然后 调用 它 ， 从 命令 行 执行 命令 Lein run -m my-cli.core/add-main: 


$ lein run -m my-cli.core/add-main 1 2 3 
The sum is: 6 


下 





3.5 节 “ 运 行 Clojure 程序 ， 了 解 如 何 利用 java 运行 普通 的 Clojure 文件 。 
。 3.7 市 “解析 命令 行 参 数 "， 了 人 解 如 何 利用 tools.cli 解析 命令 行 参 数 。 

。 8.2 市 “将 项 目 打包 成 JAR 文件 "， 了 解 如 何 将 应 用 打包 成 可 执行 的 JAR。 
。 8.4 市 “将 应 用 作为 守护 进程 运行 "， 了 人 解 如 让 应 用 成 为 守护 进程 。 


3.7 ”解析 命令 行 参数 


作者 : Ryan Neufeld， 最 初 由 Nicolas Bessi 提交 











问题 
需要 用 Clojure 编写 命令 行 工具 ， 解 析 输 入 参数 。 
5 
解决 方案 
用 tools.cli 库 (https://github.com/clojure/tools.cli) 。 


要 继续 这 个 实例 ， 请 将 [org.clojure/tools.cli "9.2.4"] 加 入 项 目 依赖 关系 中 ,或 用 lein-try 
开始 REPL: 





$ lein try org.clojure/tools.cli 


在 项 目的 -maiin 函数 入 口 点 中 使 用 clojure.tools.cliycli， 来 解析 命令 行 参数 !: 





(require '[clojure.tools.cli :refer [cli]]) 


(defn -main [& args] 
(let [[opts args banner] (cli args 











注 1: 由 于 tools.cli 如 此 方便 实用 ， 所 以 这 个 例子 完全 可 以 跑 在 REPL 中 。 




















["-h" "--help" "Print this help" 
:default false :flag true])] 
(when (:help opts) 
(println banner)))) 


;; 模拟 在 命令 行 中 进入 -main 
(-main "-h") 


;3 OU 上 
;; Usage : 
Switches DefauLt Desc 
-h, --no-help, --help false Print this help 
Be VAN 
讨论 





Clojure 的 tools.clt 是 一 个 简单 的 库 ， 只 有 一 个 函数 ct， 以 及 一 个 简洁 的 、 面 向 对 象 的 
API， 用 于 指定 参数 应 该 如 何 解析 。 这 个 函数 非常 简便 :提供 参数 向 量 和 规格 说 明 ， 得 到 
解析 后 选项 的 映射 表 ， 可 变 长 度 的 参数 ， 以 及 帮助 信息 。 它 确实 体现 了 良好 的 、 可 组 合 的 
函数 式 编程 。 


要 配置 选项 如 何 解 析 ， 只 需 在 args 列表 之 后 传人 任意 一 个 规格 说 明 向 量 。 例 如 ， 要 指 
定 :port 参数 ， 可 以 提供 规格 说 明 ["-p" "--port"]。"-p" 不 是 必须 的 ， 而 是 为 命令 行 选 
项 提供 一 个 字母 的 缩写 方式 (尤其 是 选项 比较 长 时 )。 在 返回 的 opts 映射 表 中 ， 选 项 名 称 
的 文本 将 转变 成 关键 字 (去 掉 --)。 例 如 ,，"--port" 将 变 成 :port，"--super-long-option" 
将 变 成 :super-Long-option。 















































一 个 有 素养 的 命令 行 应 用 开发 者 会 为 每 个 选项 加 上 描述 。 这 将 作为 可 选 的 字符 串 ， 跟 在 最 
终 的 参数 名 称 后 面 : 





["-p" "--port" "The incoming port the application will listen on."] 














参数 名 称 和 描述 之 后 的 东西 ， 都 将 被 解释 为 键 值 对 形式 的 选项 。tools.cli 提供 以 下 的 
选项 : 
:default 

用 户 没 有 输入 时 的 默认 值 。 如 果 没 有 指定 ，:default 的 默认 值 是 nil。 














:flag 
如 果 为 真 ( 不 是 false 或 nil)， 表 明和 参数 就 像 一 个 标志 或 开关 。 该 参数 不 会 接受 任何 
值 作为 其 输入 。 











:parse-fn 


用 于 解析 参数 值 的 函数 。 它 可 以 用 于 将 字符 串 转 换 成 整数 、 浮 点 数 ， 或 其 他 数据 类 型 。 





:assoc-fn 
用 于 将 多 个 值 组 合成 一 个 参数 的 函数 。 
下 面 是 完整 的 例子 : 





7 











--count" :default 5 
:parse-fn #(Integer. %) 
:assoc-fn max] 

["-v" "--verbose" :flag true 

:default true]]) 


(def app-specs [["-n 


(first (apply cli ["-n" "2" "-n" "50"] app-specs)) 
;; -> {:count 50, :verbose true} 


(first (apply cli ["--no-verbose"] app-specs)) 
;; -> {:count 5, :verbose false} 


任 写 标志 选项 时 ， 省 略 :flag 选项 ， 为 参数 名 称 加 上 "[no-]" 前 级 是 一 条 可 行 的 捷径 。c1ti 
会 将 这 个 参数 规格 说 明 解 释 为 包含 :flag true， 不 用 再 指定 : 





["-v" "--[no-]verbose" :default true] 


有 一 项 功能 tools.cli 没有 提供 ， 就 是 钧 入 应 用 容器 的 启动 生命 周期 。 需 要 在 -main 函数 
中 添加 ctLi 调用 ， 并 知道 何 时 打印 帮助 信息 。 一 般 的 用 法 是 在 let 块 中 记录 下 ctLi 的 结 
果 ， 并 确定 是 否 需要 打印 帮助 信息 。 这 对 于 确保 参数 的 有 效 性 也 很 有 用 (尤其 是 因为 没 
有 :required 选项) : 








(def required-opts #{:port}) 


(defn missing-required? 
"Returns true if opts is missing any of the required-opts" 
[opts ] 
(not-every? opts required-opts)) 


(defn -main [& args] 
(let [[opts args banner] (cli args 
["-h" "--help" "Print this help" 
:default false :flag truel] 
["-p" "--port" :parse-fn #(Integer. %)])] 
(when (or (:help opts) 
(missing-required? opts)) 
(println banner)))) 


许多 应 用 可 能 希望 接受 可 变数 量 的 参数 ， 例 如 一 组 文件 名 。 在 大 部 分 情况 下 ， 不 需要 做 什 
么 特殊 工作 ， 只 要 将 它们 放 在 其 他 选项 后 面 。 这 些 可 变数 量 的 参数 将 作为 cti 返回 向 量 的 
第 二 个 元 素 返 回 。 











(second (appLy cLL ["-n" "5" "foo.txt" "bar.txt"] app-specs)) 
;; -> ["foo.txt" "bar.txt"] 





但 是 ， 如 果 可 变数 量 的 参数 看 起 来 像 标 志 ， 就 需要 另 一 个 技巧 。 用 -- 作为 一 个 参数 ， 告 
诉 ctLi 之 后 的 东西 都 是 可 变数 量 的 参数 。 如 果 要 调用 另 一 个 程序 ， 它 的 参数 先 传 给 你 的 程 
序 ， 这 样 做 就 很 有 用 : 





(second (apply cli ["-n" "5" "--port" "80"] app-specs)) 
;; -> Exception '--port' is not a valid argument ... 


(second (apply cli ["-n" "5 "--" "--port" "80"] app-specs)) 
es Sy ["--port" "80"] 


在 REPL 中 完成 了 应 用 的 选项 解析 尝试 之 后 ， 你 可 能 希望 尝试 通过 lein run 来 调用 选项 。 
就 像 应 用 需要 用 - - 来 表明 哪些 参数 是 传递 给 后 续 程序 ， 也 必须 用 -- 告诉 Lein run， 哪 些 
参数 是 给 你 的 程序 的 ， 哪 些 参 数 是 给 它 的 : 


# 如 果 app-specs 被 配置 给 了 一 个 项 目 …… 
$ lein run -- -n 5 --no-verbose 





参阅 

。 3.6 节 “ 从 命令 行 运行 程序 ， 了 解 从 命令 行 局 动 应 用 的 更 多 内 容 。 

。 4.1 节 “ 写 和 人 STDOUT 和 STDERR”， 了 解 输入 和 输出 流 。 

。 8.2 节 “ 将 项 目 打包 成 JAR 文件 ， 了 解 如 何 将 应 用 打包 成 可 执行 的 JAR 文件 。 

。 要 构建 Ncurses 风格 的 应 用 ， 参 见 clojure-lanterna (http://sjl.bitbucket.org/clojure- 
lanterna/) ， 它 封装 了 Lanterna 终端 输出 库 。 


3.8 创建 定制 的 项 目 模板 


作者 : Travis Vachon 














问题 
经 常 需要 创建 新 的 、 类 似 的 项 目 ， 希 望 有 容易 的 方法 来 生成 定制 的 样板 文件 。 或 者 ， 你 在 
开发 一 个 开源 项 目 ， 希 望 为 用 户 提供 一 种 使 用 你 的 软件 的 容易 的 方法 。 


解决 方案 
Leiningen 模板 为 Clojure 程序 员 提供 了 一 种 容易 的 方式 ， 用 一 条 命令 自动 生成 定制 的 项 目 
样板 文件 。 通 过 创建 一 个 简单 Web 服务 的 模板 ， 我 们 来 探索 一 下 。 














首先 ， 用 Lein new template cookbook-sample-template-<github_user> 生成 一 个 新 模板 。 
将 <github_user> 替换 为 你 自己 的 GitHub 用 户 名 ， 因 为 将 要 把 这 个 模板 发 布 到 Clojars， 它 
需要 一 个 唯一 的 名 字 。 在 这 个 例子 中 ， 使 用 clojure-cookbook 作为 GitHub 用 户 名 : 
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$ lein new template cookbook-sample-template-clojure-cookbook 
Generating fresh 'lein new' template project. 


$ cd cookbook-sample-template-clojure-cookbook 











队 
| 


一 个 新 的 项 目 文件 模板 ， 内 容 如 下 : 





在 src/leiningen/new/<project-name>/project.clj 中 创 妇 


(defproject {{ns-name}} "0.1.0" 
:description "FIXME: write description" 
:url "http://example.com/FIXME" 

:license {:name "Eclipse Public License" 


:url "http://www.eclipse.org/legal/epl-v10.html"} 
:dependencies [[org.clojure/clojure "1.5.1"]]) 











因为 要 创建 Web 服务 的 模板 ， 和 希望 Clojure 的 ring 和 ring-jetty-adapter 也 默认 提供 ， 所 
以 将 它们 加 到 :dependencies 中 : 





:dependencies [[org.clojure/clojure "1.5.1"] 
[ring "1.1.8"] 
[ring/ring-jetty-adapter "1.2.0"]] 


接 下 来 ,打开 模板 定义 (src/leiningen/mew/<project-name>.clj)， 将 project.clj 添加 到 要 生 
成 的 文件 列表 中 。 将 sanitize-ns 添加 到 命名 空间 的 :require 指令 中 ， 提 供 清 洁 的 命名 空 
间 字 符 串 : 


(ns leiningen.new.cookbook-sample-template-clojure-cookbook 
:require [leiningen.new.templates :refer [renderer 
i leini templat f d 
name-to-path 
->files 
sanitize-ns]] 
[leiningen.core.main :as main])) ; © 

















(def render (renderer "cookbook-sample-template-clojure-cookbook")) 


(defn cookbook-sample-template-clojure-cookbook 
"FIXME: write documentation" 
[name] 
(let [data {:name name 
:ns-name (sanitize-ns name) ;© 
:sanitized (name-to-path name)}] 
(->files data 
["project.clj" (render "project.clj" data)] ;© 
["src/{{sanitized}}/foo.clj" (render "foo.clj" data)]))) 


@ 将 sanitize-ns 添加 到 :require 指令 中 。 
@ 提供 :ns-name 作为 简写 形式 name。 
四 将 project.clj 添加 到 模板 的 文件 列表 中 。 


好 的 模板 为 用 户 提供 了 一 个 基本 框架 ， 可 以 在 此 基础 上 构建 。 创 建新 的 文件 src/leiningen/ 
new/<project-name>/site.clj， 提 供 Web 服务 逻辑 的 梗概 : 
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(ns {{ns-name}}.site 
"My website! It will rock!" 
(:require [ring.adapter.jetty :refer [run-jetty]])) 


(defn handler [request] 
{:status 200 
:headers {"Content-Type" "text/html"} 
:body "Hello World"}) 


(defn -main [] 
(run-jetty handler {:port 3000})) 





回 到 模板 的 project.clj 文件 ， 为 :main 选项 添加 键 和 值 ， 表 明 my-website.site 是 项 目的 核 
心 可 执行 命名 空间 : 











:main {{ns-name}}.site 


回 到 模板 定义 (<project-name>.clj)， 将 两 个 foo.clj 引用 改 成 site.cLj。 同 时 删除 文件 


src/leiningen/new/<project-name>/foo.clj。 


9393 。。。 


["src/{{sanitized}}/site.clj" (render "site.clj" data)]))) 


要 在 本 地 测试 该 模板 ， 将 模板 项 目的 根 路 径 作为 当前 路 径 ， 并 运行 : 





$ lein install 
$ lein new cookbook-sample-template-clojure-cookbook my-first-website --snapshot 
$ cd my-first-website 
$ lein run 
# ... Leiningen noisily fetching dependencies ... 
2013-08-22 16:41:43.337:INFO:oejs.Server:jetty-7.6.8.v20121106 
2013-08-22 16:41:43.379: 
INF0:oejs.AbstractConnector:Started SelectChannelConnector@0.0.0.0:3000 


如 果 Lein 不 能 找到 模板 ， 并 打印 出 错误 ， 就 要 用 Lein upgrade， 确认 使 用 的 是 最 新 版 本 。 


要 向 其 他 用 户 提供 该 模板 ， 就 要 将 它 发 布 到 Clojars。 首 先 ， 打 开 模 板 项 目的 project.clj， 将 
版 本 改 成 发 布 版 ， 因 为 默认 Lein 仅 使 用 非 SNAPSHOT 的 模板 : 





(defproject cookbook-sample-template-clojure-cookbook/lein-template "0.1.0" 


接 下 来 ， 访 问 clojars.org， 创 建 Clojars 账户 ， 然 后 从 模板 项 目的 根 路 径 部 署 : 


$ lein deploy clojars 











其 他 用 户 现 在 可 以 用 你 的 模板 名 称 作 为 Lein new 的 第 一 个 参数 ， 创 建新 的 项 目 了 。 
Leiningen 将 自动 从 Clojars 获取 项 目 模板 : 











$ lein new cookbook-sample-template-clojure-cookbook my-second-website 
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讨论 

Leiningen 利用 Clojars 作为 知名 模板 来 源 。 如 果 将 模板 名 称 传递 。 给 lein new， 它 先 会 在 
本 地 Maven 库 中 按 名 称 查 找 该 模板 。 如 果 没 找到 ， 就 会 在 http://clojars.org 上 查找 相应 命 
名 的 模板 。 如 果 找 到 ， 就 会 下 载 该 模板 ， 用 它 来 创建 新 项 目 。 结 果 得 到 几乎 像 魔法 一 样 的 
项 目 创建 接口 ， 非 常 适合 Clojure 程序 员 快 速 接触 新 技术 。 


























下 载 了 项 目 模板 之 后 ，Leiningen 将 利用 src/leiningen/new/<project-name>.clj 来 创建 新 项 目 。 
这 个 文件 可 以 彻底 定制 ， 以 创建 满足 要 求 的 复杂 模板 。 我 们 将 探讨 这 个 文件 ， 并 讨论 模板 
开发 者 可 用 的 一 些 工 具 。 





我 们 先 声明 一 个 符合 模板 名 称 的 命名 空间 ， 并 请 求 一 些 有 用 的 函数 ， 它 们 是 Leiningen 专 
为 模板 开发 提供 的 Leiningen.new.templates 还 包含 了 各 种 其 他 函数 ， 在 开发 自己 的 模板 之 
前 值得 了 解 一 下 ， 因 为 你 在 开发 过 程 中 遇 到 的 问题 ， 这 个 库 可 能 已 经 解决 了 。 在 这 个 例子 
中 ，name-to-path 和 sanitize-ns 将 帮助 创建 一 些 字符 串 ， 它 们 将 在 一 些 位置 替 换文 件 模 
板 中 的 内 容 : 








(ns leiningen.new.cookbook-sample-template-clojure-cookbook 
(:require [leiningen.new.templates :refer [renderer 
name-to-path 
->files 
sanitize-ns]])) 


新 项 目的 生成 是 加 载 一 组 mustache 模板 文件 ， 并 按照 一 组 命名 的 字符 串 对 它们 进行 泻 
染 。renderer 国 数 创建 了 一 个 国 数 ， 它 在 模板 名 称 确 定 的 位 置 ， 查 找 mustache 模板 。 在 
这 个 例子 中 ， 它 将 在 src/leiningen/new/cookbook_sample_template_clojure_cookbook/ 中 
查找 模板 : 











(def render (renderer "cookbook-sample-template-clojure-cookbook")) 


延续 配置 的 惯例 ，Leiningen 将 在 这 个 命名 空间 中 查找 一 个 与 模板 同名 的 函数 。 在 这 个 函数 
中 可 以 执行 任何 Clojure 代码 ， 这 意味 着 项 目的 生成 可 以 达到 任意 的 复杂 度 : 
(defn cookbook-sample-template-clojure-cookbook 


"FIXME: write documentation" 
[name] 





演 染 程序 将 使 用 这 些 数据 ， 利 用 提供 的 模板 创建 新 的 项 目 文件 。 在 这 个 例子 中 ， 我 们 让 模 
板 能 知道 项 目 名 称 、 从 该 名 称 时 出 的 命名 空间 ， 以 及 基于 该 名 称 的 清洁 的 路 径 : 





(Let [data {:name name 
:ns-name (sanitize-ns name) 
:sanitized (name-to-path name)}] 


最 后 ， 我 们 向 ->files ( 读 作 “to files”) 函数 传 入 一 个 列表 ， 包 含 文件 名 / 内 容 的 三 元 组 。 
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文件 名 确定 新 项 目 中 文件 将 放 在 哪里 。 内 容 是 利用 前 面 定 义 的 render 函数 生成 的 。render 
接受 到 模板 文件 的 相对 路 径 ， 以 及 我 们 创建 的 键 值 映射 : 











(->files data 
["project.clj" (render "project.clj" data)] 
["src/{{sanitized}}/site.clj" (render "site.clj" data)]))) 





Moustache 模板 非常 简单 ， 只 实现 简单 的 键 禁 换 。 例 如 ， 下 面 的 代码 片 自用 于 为 新 项 目的 主 
文件 site.clj 生成 ns 语句 : 














(ns {{ns-name}}.site 
"My website! It will rock!" 
(:require [ring.adapter.jetty :refer [run-jetty]])) 











Leiningen 模板 是 强大 的 工具 ， 帮 Clojure 开发 者 省 去 了 建立 项 目的 辛苦 工作 。 更 重要 的 是 ， 
它们 对 开源 开发 者 非常 有 价值 ， 可 以 展示 他 们 的 项 目 ， 让 潜在 用 户 极其 容易 地 开始 接触 一 
个 不 熟悉 的 软件 。 如 果 你 开发 Clojure 已 经 有 一 段 时 间 ， 哪 怕 只 是 刚刚 开始 ， 都 值得 花 时 
间 立 刻 尝 试 一 下 1 



































参阅 

。 ” Leiningen 模板 文档 (https://github.com/technomancy/leiningen/blob/master/doc/TEMPLATES.md)。 

。 leiningen.new.templates 命名 空间 的 源 代码 (https://github.com/technomancy/leiningen/ 
blob/master/src/leiningen/new/templates.clj ) 。 


。 mustache 模板 (http:/mustache.github.io/) 。 


3.9 构建 具有 多 态 行为 的 函数 


作者 : Ryan Neufeld， 最 初 由 David McNeil 提交 


希望 创建 一 些 函 数 ， 其 行为 随 传 入 的 参数 不 同 而 不 同 。 例 如 ， 希 望 开发 一 组 灵活 的 儿 何 
函数 。 


解决 方案 


要 实现 运行 时 多 态 ， 最 容易 的 方法 是 通过 手工 的 、 基 于 映射 的 分 派 ， 利 用 cond 或 condp 这 
样 的 函数 : 





(defn area 
"Calculate the area of a shape" 
[shape] 





(condp = (:type shape) 
:triangle (* (:base shape) (:height shape) (/ 1 2)) 
:rectangle (* (:Length shape) (:width shape)))) 


(area {:type :triangle :base 2 :height 4}) 
;; -> 4N 


(area {:type :rectangle :length 2 :width 4}) 
;; ->8 


但 这 种 方法 有 点 原始 : area 与 分 派 和 多 种 形状 的 实现 绑 在 一 起 ， 都 在 一 个 函数 中 。 利 用 
defmulti 和 defmethod 宏 来 定义 多 重 函 数 ， 将 分 离 分 派 和 实现 ， 引 入 一 定 程度 的 可 扩展 性 : 





(defmulti area 
"Calculate the area of a shape" 
:type) 


(defmethod area :rectangle [shape] 
(* (:Length shape) (:width shape))) 


(area {:type :rectangle :length 2 :width 4}) 
;; -> 8 


;; 尝试 取得 新 形状 的 面积 …… 

(area {:type :circle :radius 1}) 

;; -> IllegalArgumentException No method in multimethod 'area' for 
Ss dispatch vaLue: :circle ... 


(defmethod area :circle [shape] 
(* (. Math PI) (:radius shape) (:radius shape))) 


(area {:type :circle :radius 1}) 
;; -> 3.141592653589793 


这 要 好 一 些 ， 但 如 果 和 希望 加 入 新 的 几何 国 数 ， 如 perimeter， 代 码 就 开始 散乱 了 。 如 果 使 
用 多 重 方法 ， 就 要 为 每 个 国 数 重 复 分 派 逻辑 ， 因 为 组 合 爆炸 而 需要 编写 大 量 的 实现 。 如 有 果 
这 些 函 数 和 实现 能 够 分 组 并 写 在 一 起 ， 就 更 好 了 。 














利用 Clojure 的 protocol 机 制 来 定义 协议 接口 ， 并 用 具体 实现 对 它 进行 扩展 : 


;; 定义 Shape 对 象 的 " 形状 " 
(defprotocol Shape 
(area [s] "Calculate the area of a shape") 
(perimeter [s] "Calculate the perimeter of a shape")) 


;; 定义 具体 的 Shape，Rectangle 
(defrecord Rectangle [length width] 
Shape 
(area [this] (* length width)) 
(perimeter [this] (+ (* 2 length) 
(* 2 width)))) 
(->Rectangle 2 4) 





;; -> #user.Rectangle{:length 2, :width 4} 


(area (->Rectangle 2 4)) 
33 -> 8 


讨论 

正如 这 个 实例 所 示 ， 在 Clojure 中 有 许多 不 同方 式 来 实现 多 态 。 虽 然 前 面 的 例子 最 后 用 了 
协议 作为 实现 多 态 的 方法 ， 但 选择 哪 种 技术 ， 并 没有 硬性 的 规定 和 快捷 的 方法 。 每 种 方法 
都 有 自己 特有 的 一 些 折 中 ， 在 实现 多 态 时 需要 考虑 。 


第 一 种 方法 是 简单 的 基于 映射 的 多 态 ， 使 用 condp。 回 顾 一 下 就 会 发 现 ， 它 不 是 在 Clojure 
中 构建 几何 库 的 好 选择 ， 但 这 不 是 说 它 毫 无 用 处 。 这 种 方法 适合 小 规模 编程 (http:/ 
en.wikipedia.org/wiki/Programming_in_the_large_and_programming_in_the_small) : 你 可 以 在 


REPL 中 ， 用 cond 作为 协议 早期 迭代 的 原型 ， 或 者 用 在 不 准备 定义 新 类 型 的 地 方 。 


要 注意 的 是 ， 除 了 cond 之 外 ， 还 有 别 的 技术 来 实现 基于 映射 的 分 派 。 甚 中 一 种 技术 是 用 一 
个 分 派 映射 表 ， 一 般 实 现 为 键 与 国 数 的 映射 表 。 

下 一 种 方法 是 采用 多 重 方法 。 不 像 基于 cond 的 多 态 ， 多 重 方法 分 离 了 分 派 和 实现 。 由 于 
这 一 点 ， 它 们 可 以 在 创建 之 后 扩展 。 多 重 方法 的 定义 使 用 了 defmulti 宏 ， 它 的 行为 类 似 于 
defn， 但 指定 了 一 个 分 派 函 数 ， 而 不 是 一 种 实现 。 


让 我 们 来 分 解 一 个 相当 简单 的 多 重 方法 的 defmulti 声明 ， 即 area 函数 : 












































(defmulti area ; 0 
"Calculate the area of a shape”" ; © 
:type) ; 日 


@ 这 个 多 重 方法 的 函数 名 。 
名 描述 该 函数 的 文档 字符 串 。 
四 分 派 函 数 。 





使 用 关键 字 :type 作为 分 派 国 数 ， 并 不 能 充分 说 明 多 重 方法 的 灵活 性 : 它们 的 能 力 强 得 多 。 
多 重 方法 允许 对 调用 的 参数 执行 任意 复杂 的 检查 。 


如 果 选 择 像 :type 这 样 的 映射 表 查 询 作 为 分 派 函 数 ， 就 隐 含 了 函数 的 元 数 ( 它 接受 的 参数 
个 数 )。 因 为 关键 字 作 为 接受 一 个 参数 (映射 表 ) 的 函数 ， 所 以 area 是 一 个 单 “ 元 数 ” 函 
数 。 其 他 函数 会 隐 仿 不同 的 元 数 。 对 于 多 重 函 数 ， 常 见 的 模式 是 使 用 匿名 函数 ， 让 多 重 函 
数 对 元 数 的 要 求 更 明显 : 

















(defmulti ingest-message 
"Ingest a message into an application" 
(fn [app message] ; 0 
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(:priority message)) ; @ 
:default :low) ; 【3) 


@ ingest-messages 接受 两 个 参数 ，app 和 message。 


@@ message 的 不 同 处 理 取 决 于 它 的 优先 级 。 
加 如 果 message 中 没有 :priority 键 ， 默 认 的 优先 级 是 :Low。 





如 果 没 有 指定 ， 默 认 的 分 派 值 是 :default。 


(defmethod ingest-message :low [app message] 
(println (str "Ingesting message " message ", eventually..."))) 


(defmethod ingest-message :high [app message] 
(println (str "Ingesting message " message ", now."))) 


(ingest-message {} {:type :stats :value [1 2 3]}) 
;; *OUt* 
;; Ingesting message {:type :stats :value [1 2 3]}, eventually... 


(ingest-message {} {:type :heartbeat :priority :high}) 
;; *OUt* 
;; Ingesting message {:type :heartbeat, :priority :high}, now. 





目前 为 止 的 所 有 例子 中 ， 总 是 根据 一 个 值 分 派 。 多 重 方法 也 支持 所 谓 的 多 重 分 派 ， 即 一 
个 函数 可 以 根据 多 种 因素 派发 。 


通过 返回 一 个 向 量 ， 而 不 是 一 个 值 ， 可 以 作出 更 动态 的 决定 : 




















(defmulti convert 
"Convert a thing from one type to another" 
(fn [request thing] 
[(:input-format request) (:output-format request)])) ; 上 


(require 'clojure.edn) 

(defmethod convert [:edn-string :clojure] ; @ 
[_ str] 
(clojure.edn/read-string str)) 


(require 'clojure.data.json) 

(defmethod convert [:clojure :json] ; 【3) 
[_ thing] 
(clojure.data.json/write-str thing)) 


(convert {:input-format :edn-string 
:output-format :clojure} 
"{:foo :bar}") 
;; -> {:foo :bar} 


(convert {:input-format :clojure 
:output-format :json} 
{:foo [:bar :baz]}) 
;; -> "{\"foo\":[\"bar\", \"baz\"]}" 
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@ convert 多 重 方法 根据 输入 和 输出 格式 来 分 派 。 

名 convert 的 一 个 实现 将 edn 字符 串 转 成 Clojure 数据 。 

四 类 似 地 ， 一 个 实现 将 Clojure 数据 转 成 JSON。 

但 这 些 能 力 都 有 代价 。 由 于 多 重 方法 非常 动态 ， 所 以 可 能 比较 慢 。 而 且 ， 没 有 很 好 的 方法 
将 几 组 相关 的 多 重 方法 放 到 一 个 要 么 全 有 、 要 么 全 无 的 包 中 *。 如 果 主 要 考虑 速度 或 实现 一 
个 完整 的 接口 ， 协 议 可 能 是 更 好 的 选择 。 

















Clojure 的 协议 机 制 提供 了 可 扩展 的 多 态 ， 以 及 类 似 于 Java 接口 的 快速 分 派 。 它 与 多 重 方 
法 有 一 个 值得 注意 的 区 别 : 协议 只 能 执行 单 分 派 (基于 类 型 )。 











协议 是 通过 defprotocol 宏 来 定义 的 ， 它 接受 名 称 、 可 选 的 文档 字符 串 ， 以 及 不 定数 目的 
命名 方法 签名 。 方 法 签名 由 几 个 部 分 组 成 : 名 称 ， 至 少 一 个 类 型 签名 ， 以 及 可 选 的 文档 字 
符 串 。 类 型 签名 的 第 一 个 参数 总 是 该 对 象 本 身 ， 因 为 Clojure 按照 这 个 参数 的 类 型 来 分 派 。 
也 许 例 子 是 阐明 defprotocol 语法 最 容易 的 方法 : 





(defprotocol Frobnozzle 
"Basic methods for any Frobnozzle" 
(blint [this x] "Blint the frobnozzle with x") ; 0 
(crand [this f] [this f x] (str "Crand a frobnozzle with another " ; @ 
"optionally incorporating x"))) 


@ 函数 blint， 带 有 一 个 额外 参数 x。 
加 多 元 数 函 数 crand， 带 有 可 选 的 x 参数 。 


定义 了 协议 之 后 ， 有 许多 种 方式 来 实现 它 。deftype、defrecord 和 reify 都 在 创建 对 象 的 
同时 ， 定义 了 协议 的 实现 。 deftype 和 defrecord 创建 了 新 的 命名 类 型 ， 而 reify 创建 了 匿 
名 类 型 。 每 种 形式 都 表明 协议 被 扩展 了 ， 紧 接着 是 协议 的 每 个 方法 的 具体 实现 : 


;; deftype 的 语法 类 似 ， 但 并 不 适用 于 不 可 变 的 形状 
(defrecord Square [Length] 
Shape ; 0 
(area [this] (* Length Length)) ; @ 
(perimeter [this] (* 4 Length) ) 
; 日 
) 


























(perimeter (->Square 1)) 
;; -> 4 


;; 计算 平行 四 边 形 的 面积 ， 不 定义 记录 


(area 

















注 2: 这 就 是 说 ， 在 将 行为 扩展 到 它 自己 的 类 型 时 ， 不 能 强制 多 重 方法 实现 所 有 要 求 的 方法 。 


























(reify Shape 
(area [this] (* b h)) 
(perimeter [this] (* 2 (+ b h)))))) 
;; ->6 
@ 表明 要 实现 的 协议 。 
@ 实现 它 的 所 有 方法 。 
@@ 对 所 有 要 实现 的 协议 ， 重 复 第 1 步 和 第 2 步 。 








类 型 与 记录 的 区 别 
类 型 和 记录 的 语法 非常 类 似 ， 所 以 很 难 理解 何 时 该 用 哪 一 个 。 
Chas Emerick 在 Clojure Programming (O’Reilly, http://www.clojurebook.com/) 一 书 的 附 
录 中 解释 得 非常 好 : 
类 对 领域 值 建 模 ， 因 此 受益 于 类 似 哈 希 映射 表 的 功能 和 语义 吗 ? 用 defrecord。 
需要 定义 可 变 的 字段 吗 ? 用 deftype。 
这 下 清楚 了 。 











要 在 已 有 的 类 型 上 实现 协议 ， 就 要 用 到 内 建 的 extend 函数 族 (extend、extend-type 和 
extend-protocol)。 这 些 函 数 不 是 定义 新 类 型 ， 而 是 在 已 有 的 类 型 上 定义 实现 。 











参阅 

。 多 重 方法 与 层级 的 官方 文档 (http://clojure.org/multimethods) ， 深 度 探 讨 了 多 重 方法 。 这 
份 文档 也 介绍 了 层级 ， 因 为 它 也 与 多 重 方法 有 关 ， 而 本 实例 没有 介绍 。 

。 协议 的 官方 文档 (http:Wclojure.org/protocols) , 深度 探讨 了 协议 , 包括 协议 与 接口 的 关系 。 

。 2.28 节 “ 实 现 定制 的 数据 结构 : 红 黑 树 (第 二 部 分 )”， 有 实现 协议 的 具体 例子 。 

。 3.10 节 “扩展 内 建 的 类 型 "， 例 如 使 用 extend 及 其 方便 的 宏 extend-type 和 extend-protocot。 


3.10 ”扩展 内 建 的 类 型 


作者 : David McNeil 

















问题 
需要 用 自己 的 函数 扩展 内 建 的 类 型 。 








解决 方案 

假定 需要 在 核心 的 java.tang.string 类 型 上 添加 领域 特定 的 函数 。 在 这 个 例子 中 ， 要 为 
String 添加 first-name 和 Last-nane 函数 。 定 义 一 个 协议 ， 包 含 需要 的 函数 。 协 议 声明 了 
函数 签名 : 





(defprotocol Person 
"Represents the name of a person." 
(first-name [person]) 
(last-name [person])) 


扩展 java.Lang.String 类 的 类 型 . 


(extend-type String 
Person 
(first-name [s] (first (clojure.string/split s #" "))) 
(Last-name [s] (second (clojure.string/split s #" ")))) 


现在 可 以 在 字符 串 上 调用 你 的 函数 : 


(first-name "john") 
;; -> "john" 


(last-name "john smith") 
;; -> "smith" 


讨论 
既然 已 经 有 了 多 重 方法 ， 为 什么 要 用 协议 ? 一 个 理由 就 是 速度 : 协议 只 按 第 一 个 参数 的 类 


型 来 分 派 。 而 且 ， 协 议 允 许 对 扩展 进行 分 组 和 命名 。 这 样 推断 哪些 函数 归属 哪个 类 型 就 容 
易 得 多 ， 并 且 确 保 了 合适 的 、 完 整 的 实现 。 


只 有 当 你 是 协议 或 类 型 的 作者 时 ， 才 将 协议 扩展 为 一 个 类 型 ， 这 是 一 种 很 好 的 实践 方式 。 
这 样 能 避免 违反 最 初 作者 的 假定 。 











下 














如 果 已 经 有 一 些 函 数 要 使 用 ， 那 么 就 使 用 extend， 而 不 是 extend-type: 


(defn first-word [s] 
(first (clojure.string/split s #" "))) 


(defn second-word [s] 
(second (clojure.string/split s #" "))) 


(extend String 
Person 
{:first-name first-word 
:last-name second-word}) 
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阅 

。 Jorg W Mittag 在 StackOverflow 上 回答 了 “Expression Problem” (http://stackoverflow.com/ 
questions/4509782/simple-explanation-of-clojure-protocols/4513556#4513556) ， 很 好 地 解释 了 为 
什么 协议 会 存在 。 


3.11 用 core.async 解除 消费 者 和 生产 者 的 耦合 


作者 : Daemian Mack 


笛 








问题 
需要 在 消费 者 和 生产 者 之 间 引 入 显 式 的 队列 ， 解 除 它 们 的 耦合 








例如 ， 如 果 要 建立 一 个 Web 仪表 板 ， 取 得 Twitter 消息 ， 这 个 应 用 必须 将 这 些 消 息 持久 到 
数据 库 ， 并 通过 服务 器 发 送 事件 (SSE) 发 布 给 浏览 器 。 


解决 方案 
在 组 件 间 引入 显 式 的 队列 ， 让 它们 能 够 异步 通信 ， 使 它们 更 容易 独立 管理 ， 并 释放 计算 资 
源 。 利 用 core.async 库 (https://github.com/clojure/core.async) 来 引入 和 协调 异步 信道 。 






































要 继续 这 个 实例 ， 请 用 Lein-try 开始 REPL : 


$ lein try org.clojure/core.async 
请 考虑 以 下 代码 ， 它 展示 了 一 种 同步 的 方式 : 


(defn database-consumer 
"Accept messages and persist them to a database." 


[msg] 
(println (format "database-consumer received message %s" msg))) 


(defn sse-consumer 
"Accept messages and pass them to web browsers via SSE." 


[msg] 
(println (format "sse-consumer received message %s" msg))) 


(defn messages 
"Fetch messages from Twitter." 


(range 4)) 


(defn message-producer 
"Produce messages and deliver them to consumers." 
[& consumers] 
(doseq [msg (messages) 
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consumer consumers] 
(consumer msg))) 


(message-producer database-consumer sse-consumer) 
人 OUt* 

;; database-consumer received message 0 

;; Sse-consumer received message 0 

;; database-consumer received message 1 

;; sse-Consumer received message 1 

;; database-consumer received message 2 

;; Sse-consumer received message 2 

;; database-consumer received message 3 

;; Sse-consumer received message 3 


接收 到 的 每 条 消息 直接 传递 给 了 message-producer 的 消费 者 。 这 种 实现 方式 非常 脆弱 ， 只 
要 有 慢 速 的 消费 者 ， 整 个 管道 就 会 慢 慢 停 下 来 。 


要 实现 异步 处 理 ， 就 用 clojure.core.async/chan 引入 显 式 的 队列 。 将 工作 包装 在 core. 
async 中 的 一 种 clojure.core.async/go 形式 中 ， 实 现 工作 的 异步 执行 : 





(require '[clojure.core.async :refer [chan sliding-buffer go 
go-Loop timeout >! <!]]) 


(defn database-consumer 
"Accept messages and persist them to a database." 
[] 
(let [in (chan (sliding-buffer 64))] 
(go-Loop [data (<! in)] 
(when data 
(println (format "database-consumer received data %s" data)) 
(recur (<! in)))) 


in)) 


(defn sse-consumer 

"Accept messages and pass them to web browsers via SSE." 

[] 

(let [in (chan (sliding-buffer 64))] 

(go-loop [data (<! in)] 
(when data 

(println (format "sse-consumer received data %s" data)) 
(recur (<! in)))) 


in)) 


(defn messages 
"Fetch messages from Twitter." 


[] 
(range 4)) 


(defn producer 
"Produce messages and deliver them to consumers." 
[& channels] 
(go 
(doseq [msg (messages) 
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out channels] 
(<! (timeout 100)) 
(>! out msg)))) 


(producer (database-consumer) (sse-consumer)) 
;; *OUut* 

;; database-consumer received data 0 

;; Sse-consumer received data 0 

;; database-consumer received data 1 

;; Sse-consumer received data 1 

;; database-consumer received data 2 

;; Sse-consumer received data 2 

;; database-consumer received data 
;; Sse-consumer received data 3 


讨论 


在 所 有 好 的 程序 中 ， 组 件 或 子 系统 之 间 必 须 停 止 直接 通信 ， 这 样 的 时 刻 终 将 到 来 。 


Lu 


一 一 Rich Hickey 


Clojure core.async Channels 


这 段 代 码 比 最 初 的 实现 要 长 。 它 给 我 们 带 来 了 什么 好 处 ? 





最 初 的 实现 是 呆板 的 。 它 没有 提供 对 消费 者 延迟 的 控制 ， 因 此 非常 容易 拖延 。 利 用 信道 来 
缓冲 通信 ， 异 步 地 完成 工作 ， 我 们 就 在 生产 者 和 消费 者 之 间 创 建 了 服务 边界 ， 让 它们 能 够 
尽 可 能 独立 地 运行 。 

让 我 们 仔细 检查 一 个 新 的 消费 者 ， 理 解 发 生 了 什么 变化 。 


现在 消费 者 不 是 通过 函数 调用 来 收 到 消息 ， 而 是 从 带 缓冲 的 信道 取得 消息 。 过 去 消费 者 
(如 database-consumer) 每 次 消费 一 条 消息 ， 现 在 使 用 了 go-loop， 连 续 不 断 地 从 生产 者 那 
里 消费 消息 。 


在 传统 的 回调 式 代码 中 ， 完 成 这 样 的 事情 需要 在 许多 函数 间 切 分 逻辑 ， 导 致 所 谓 的 “ 
地 狱 ” 。core.async 的 一 个 好 处 就 是 ， 它 让 你 编写 直线 式 代 码 ， 更 为 直接 明了 : 
































调 








回 











(defn database-consumer 
"Accept messages and persist them to a database." 
[] 
(let [in (chan (sliding-buffer 64))] ; © 
(go-Loop [data (<! in)] ;© 
(when data ;© 
(println (format "database-consumer received data %s" data)) 
(recur (<! in)))) ;@ 
in)) 


@ 这 里 给 信道 缓存 大 小 是 64。sLiding-buffer 变量 表明 ， 如 果 信 道 累积 超过 64 个 未 读 的 
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值 ， 老 的 值 就 开始 “丢失 ”， 它 更 注重 新 的 值 ， 而 不 是 历史 的 完整 性 。 使 用 dropping- 
buffer 的 优化 方向 是 相反 的 。 

@@ go-loop 是 core.async 中 等 价 于 while true 这 样 的 循环 。 这 个 go-loop 从 输入 信道 
(in) 中 取 值 (<!)， 作 为 其 初始 值 。 

@ 因为 信道 在 关闭 时 返回 nit， 所 以 只 要 能 从 信道 中 读 取 数据 ， 就 表明 还 有 工作 要 做 。 

@ 要 recur 这 个 go-loop 到 开始 位 置 ， 就 从 信道 中 取 下 一 个 值 ， 以 它 为 参数 调用 recur。 


























因为 g0-loop 块 是 异步 的 ， 取 值 调 用 (<!) 会 停 在 那里 ， 直 到 有 值 投入 信道 。go-tLoop 块 的 
剩余 部 分 (这 里 是 printtn 调用 ) 就 挂 起 了 。 因 为 信道 是 作为 database-consumer 国 数 的 值 
返回 的 ， 所 以 系统 的 其 他 部 分 ( 即 生产 者 ) 可 以 在 等 侍 取 值 时 ， 自 由 地 写 入 信道 。 写 入 信 
道 的 第 一 个 值 将 满足 读 取 调 用 ， 让 go-Loop 块 的 剩余 部 分 继续 下 去 。 


这 个 消费 者 现在 是 异步 的 ， 读 取 值 直到 信道 关闭 。 因 为 信道 是 带 缓冲 的 ， 现 在 就 对 系统 的 
弹性 有 了 一 定 程度 的 控制 。 例 如 ， 缓 冲 区 允许 消费 者 比 生 产 者 延迟 一 定 的 时 间 。 


让 producer 异步 所 需 的 改动 更 少 : 
































(defn producer 
[& channels] 
(go 
(doseq [msg (messages) 
out channels] ; ©O 
(<! (timeout 100)) ;@ 
(>! out item)))) ;© 


@ 对 每 个 消息 和 信道 …… 
@ 从 tineout 信道 读 取 ， 模 拟 短暂 停顿 的 效果 …… 
@ 用 >! 向 信道 写 入 消息 。 




















尽管 操作 是 异步 的 ， 它 们 仍 是 串 行 式 执行 的 。 使 用 无 缓冲 的 消费 者 信道 意味 着 ， 如 果 一 个 
消费 者 从 信道 中 读 取 的 速度 太 慢 ， 管 道 将 停止 ， 生 产 者 将 不 能 向 信道 写 和 新 值 。 





参阅 

。 core.async 还 有 更 高 级 的 机 制 来 分 配 和 协调 信道 。 更 多 信息 ， 请 参阅 core.async 概述 
(http://clojure.github.io/core.async/) 。 

。 5.8 节 “ 并 发 使 用 ZeroMQ”， 了 解 core.async 如 何 通过 ZeroMQ 通信 。 


3.12 用 core.match 为 Clojure 表 达 式 制作 解析 器 


作者 : Chris Frisz 
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问题 
需要 解析 Clojure expressions， 例 如 ， 从 输入 变 为 宏 ， 变 为 不 同 的 表示 形式 (如 映射 表 ) 
作为 例子 ， 请 考虑 一 个 大 幅 简 化 的 Clojure 版 本 ， 包 含 以 下 的 表达 式 类 型 ; 


。 以 合法 的 Clojure 符号 表示 的 变量 
。 fn 表达 式 只 接受 一 个 参数 ， 它 的 函数 体 也 是 一 个 合法 的 表达 式 ， 
。 将 语言 中 的 一 个 合法 表达 式 作 用 于 另 一 个 合法 表达 式 。 











可 以 用 下 面 的 语法 表示 这 种 语言 : 











Expr = var 
| (fn [var] Expr) 
| (Expr Expr) 


解决 方案 


使 用 core.match 对 输入 进行 模式 匹配 ， 然 后 将 该 表达 式 作为 映射 表 的 映射 表 返 回 。 











try 开始 REPL: 
$ lein try org.clojure/core.match 


现在 ， 利 用 clojure.core.match/match 对 该 语言 的 语法 进行 编码 : 





(require '[clojure.core.match :refer (match)]) 


(defn simple-clojure-parser 
[expr] 
(match [expr] 
[(var :guard symboL?)] {:variable var} 
[(['fn [arg] body] :seq)] {:closure 
{:arg arg 
:body (simple-clojure-parser body)}} 
[([operator operand] :seq)] {:application 
{:operator (simple-clojure-parser operator) 
:operand (simple-clojure-parser operand)}} 
:else (throw (Exception. (str "invalid expression: " expr))))) 


(simple-clojure-parser 'a) 
;; -> {:variable al 


(simple-clojure-parser '(fn [x] x)) 
;; -> {:closure {:arg x, :body {:variable x}}} 


(simple-clojure-parser '((fn [x] x) a)) 
;; -> {:application 
3 {:operator {:cLosure {:arg x, :body {:variable x}}} 


o 


在 开始 前 ， 请 将 [org.clojure/core.match "6.2.0"] 加 入 你 的 项 目 依赖 关系 中 ， 或 用 Lein- 





Se :operand {:variable a}}} 














;; fn 表达 式 只 能 接受 个 参数 | 
(simple-clojure-parser '(fn [x y] x)) 
;; -> Exception invalid expression: (fn [x y] x) ... 





讨论 

hile le oo gp ea a pogo 
在 这 个 例子 中 ， 就 是 rexpr]。 这 个 向 量 不 限于 一 个 元 素 ， 它 可 以 包 合 多 个 希望 匹配 的 元 
过 第 二 孝 分 晨 一 个 可 变 的 “问题 /答案 对 ”列表 。 问 是 是 一 个 向 最 ， 表 示 ver 向量 必须 
具备 的 形状 。 像 cond 一 样 ，“ 答 案 ”是 var 清 足 问题 时 应 该 返回 的 东西， 


问题 在 core.match 中 有 几 种 形式 。 下 面 是 对 前 面 例子 的 解释 。 























。 第 一 个 匹配 模式 是 [(var :guard symbol?)]， 它 匹配 了 语法 中 变量 的 情况 ， 将 匹配 的 
表达 式 与 var 绑 定 。 特 殊 的 :guard 形式 将 谓词 symbol? 应 用 于 var， 只 在 symbol? 返回 
true 时 ， 才 返回 答案 。 

。 第 二 个 模式 是 [(['fn [arg] body] :seq)]， 匹 配 fn 的 情况 ，。 请 注意 ， 特 殊 的 ([...] 
:seq) 语法 是 用 于 匹配 列表 的 ， 在 这 里 用 来 代表 fn 表达 式 。 也 要 注意 ， 要 匹配 字面 值 
fn, 它 必须 在 匹配 模式 中 带 上 引号 。 有 趣 的 是 , 因为 这 个 解析 器 也 应 该 接受 body 表达 式 ， 
所 以 它 进 行 了 自 递归 调用 (simple-clojure-parser body)， 在 匹配 模式 的 右边 。 

。 对 第 三 个 :application 模式 ， 解 析 器 再 次 使 用 ([...] :seq) 匹配 一 个 列表 。 因 为 在 fn 
表达 式 的 函数 体 部 分 ，operator 和 operand 表达 式 都 应 该 被 解析 器 接受 ， 所 以 它 对 每 一 
个 进行 了 递归 调用 。 

， 如 果 给 的 表述 式 不 匹配 这 三 种 接受 的 模式 ， 解析 器 将 抛 出 异常 。 如 果 偶 然 向 解析 

器 提交 了 不 合法 的 表达 式 ， 这 多 少 提供 了 点 有 帮助 的 信息 。 


样 编写 解析 器 得 到 的 是 简明 的 代码 ， 非 常 像 它 所 针对 的 输入 。 或 者 ， 也 可 以 用 条 件 表 达 
i CO 










































































或 cond) 来 写 ， 显 式 地 解构 输入 。 为 了 说 明代 码 长 度 和 清晰 度 的 区 别 ， 请 看 这 个 国 
数 ， 它 只 解析 了 该 语言 的 fn 表达 式 : 








(defn parse-fn 

[expr] 

(if (and (list? expr) 
(= (count expr) 3) 
(= (nth expr 0) 'fn) 
(vector? (nth expr 1)) 
(= (count (nth expr 1)) 1)) 

{:closure {:arg (nth (nth expr 1) 0) 
:body (simple-clojure-parser (nth expr 2))}} 








注 3: 针对 fn 的 匹配 模式 可 以 (也 应 该 ) 包含 对 arg 的 检查 ， 确 保 它 是 一 个 符号 ,但 这 里 为 了 简洁 省 去 了 。 























(throw (Exception. (str "unexpected non-fn expression: " expr))))) 





看 到 这 个 版 本 需要 多 少 代 码 ， 才 能 表示 fn 表达 式 的 同样 属性 吗 ? 没 用 match 的 版 本 不 仅 需 
要 更 多 的 代码 ， 而 且 if 检测 也 不 如 match 模式 那样 像 表 达 式 的 结构 。 而 且 ，match 将 匹配 
的 输入 自动 绑 定 到 变量 名 上 ， 不 用 手工 通过 let 来 绑 定 ， 或 重复 编写 同样 的 列表 访问 代码 
(就 像 上 面 的 parse-fn 中 用 的 (nth expr) 那样 )。 显 然 ，match 版 要 更 容易 阅读 和 维护 。 





























参阅 
。 core.match 的 维基 概述 页 面 (https://github.com/clojure/core.match/wiki/Overview)， 更 全 
面 地 介绍 了 这 个 库 的 功能 。 





3.13 ”用 core.Logic 查 询 层 级 图 


作者 : Ryan Senior 


问题 

有 一 个 像 图 一 样 的 层级 数据 结构 ， 序 列 化 成 节点 的 展 平 列表 ， 需 要 进行 查询 。 例 如 ， 有 一 
个 电影 元 数据 的 图 ， 表 示 为 一 些 “ 实 体 - 属性 - 值 ” 的 三 元 组 。 用 标准 的 seq 函数 来 编写 
这 段 代 码 相当 繁琐 ， 也 容易 出 错 。 


解决 方案 
core.logic 库 是 领域 特定 语言 (DSL) miniKanren 的 Clojure 实现 ， 目 的 是 进行 逻辑 编程 。 
它 的 描述 式 风 格 很 适合 查询 展 平 的 层级 数据 。 


























要 继续 这 个 实例 ， 就 用 lein-try 开始 REPL: 


$ lein try org.clojure/core.logic 





首先 需要 待 查询 的 数据 集 。 例 如 ， 已 经 将 电影 元 数据 的 图 表示 为 三 元 组 的 列表 : 





(def movie-graph 
[;; "Newmarket FiLms" 工作 室 
[:al :type :FilmStudio] 
[:al :name "Newmarket Films"] 
[:al :filmsCollection :a2] 

















;; 由 Newmarket Films 制作 的 电影 集 
[:a2 :type :FilmCollection] 

[:a2 :film :a3] 

[:a2 :film :a6] 
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;; 电影 "Memento" 

[:a3 :type :Film] 
[:a3 :name "Memento"] 
[:a3 :cast :a4] 

















;; 电影 与 演 职 人 员 的 关联 (演员 、 导 演 、 制 作 人 等 ) 
[:a4 :type :FilmCast] 
[:a4 :director :a5] 





;; "Memento" 的 导演 
[:a5 :type :Person] 
[:a5 :name "Christopher Nolan"] 

















;; 电影 "The Usual Suspects" 

[:a6 :type :Film] 

[:a6 :filmName "The UsuaL Suspects"] 
[:a6 :cast :a7] 

















;; 电影 与 演 职 人 员 的 关联 (演员 、 导 演 、 制 作 人 等 ) 
[:a7 :type :FilmCast] 
[:a7 :director :a8] 


;; "The Usual Suspects" 的 导演 
[:a8 :type :Person] 
[:a8 :name "Bryan Singer"]]) 


























有 了 这 些 数据 后 ， 如 何 查 询 呢 ? 如 果 采 用 仓促 的 模型 ， 就 会 费力 地 一 个 一 个 “连接 这 些 节 
点 ”, 使 用 过 滤器 、 映 射 表 和 条 件 “。 但 利用 core.logic, 就 可 以 用 描述 式 的 逻辑 语句 , 来 连 
接 这 些 节点 。 


例如 ， 要 回答 问题 “哪些 导演 在 给 定 的 工作 室 执 导 过 电影 ? ”就 利用 clojure.core.logic/ 
fresh 创建 一 些 节 点 (逻辑 变量 )， 并 用 clojure.core.logic/membero 连接 它们 。 最 后 ， 调 
用 clojure.core.logic/run* 来 得 到 所 有 可 能 的 解决 方案 : 


(require '[clojure.core.logic :as cL]) 











(defn directors-at 

"Find all of the directors that have directed at a given studio" 

[graph studio-name] 

(cl/run* [director-name] 

(cl/fresh [studio film-coll film cast director] 

;; 将 最 初 的 工作 室 名 称 连接 到 电影 集 
(cl/membero [studio :name studio-name] graph) 
(cl/membero [studio :type :FilmStudio] graph) 
(cl/membero [studio :filmsCollection film-coll] graph) 


;; 将 所 有 电影 集 连接 到 它们 的 每 部 电影 
(cl/membero [film-coll :type :FilmCollection] graph) 


(cl/membero [film-coll :film film] graph) 























注 4: 我 的 天 哪 ! 
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;; 然后 是 电影 到 演 职 人 员 
(cl/membero [film :type :Film] graph) 
(cl/membero [film :cast cast] graph) 


;; 演 职 人 员 到 type :director 
(cl/membero [cast :type :FilmCast] graph) 
(cl/membero [cast :director director] graph) 


;; 最 后 ， 连 接 到 导演 姓名 
(cl/membero [director :type :Person] graph) 
(cl/membero [director :name director-name] graph)))) 





(directors-at movie-graph "Newmarket Films") 
;; -> ("Christopher Nolan" "Bryan Singer") 


讨论 

miniKanren 是 用 Scheme 写 的 领域 特定 语言 ， 目 的 是 把 逻辑 编程 语言 (如 Prolog) 中 的 许 
多 优点 引入 到 Scheme 中 。David Nolen 创建 了 miniKanren 的 Clojure 实现 ， 关 注 点 是 性 能 。 
逻辑 编程 语言 的 一 个 好 处 就 是 描述 式 风格 。 利 用 core.logic， 我 们 可 以 说 在 图 中 要 找 什 
么 ， 而 不 用 说 core. togic 应 该 到 哪里 去 找 。 





一 般 来 说 ， 所 有 core.logic 查询 都 始 于 库 提 供 的 run 宏 之 一 ，clojure.core.logic/run 返 
回 有 限 数 目的 解决 方案 ，clojure.core.logic/run* 返回 所 有 的 解决 方案 。 


run 宏 的 第 一 个 参数 是 “目标 "， 用 于 存储 查询 结果 的 变量 。 在 前 面 的 解决 方案 中 ， 就 是 
director-nane 变量 。 接 下 来 是 core.logic 程序 的 主体 。 程 序 由 一 些 “ 逻 辑 变 量 ”构成 
(用 clojure.core.logic/fresh 创建 )， 连 接 到 值 或 受 逻 辑 语 句 的 限制 。 












































run 透露 出 一 个 信息 ， 我 们 的 编程 范式 将 转变 为 逻辑 编程 。 在 core.logic 程序 中 ， 使 用 
“ 合 一 ”(unification)， 而 不 是 传统 的 变量 赋值 和 顺序 表达 式 求 值 。 合 一 通过 用 值 来 替换 变 
量 ， 尝 试 让 两 个 表达 式 在 句法 上 等 价 。core.logic 程序 中 的 语句 能 以 任何 次 序 出 现 。 例 
如 ， 可 以 用 clojure.core.logic/== 使 1 和 9 合 一 。 

















(cl/run 1 [q] 
(cl/== 1 9)) 
; -> (1) 


(cl/run 1 [q] 
(cl/== q 1)) 
;; -> (1) 


core.logic 也 能 够 让 列表 和 向量 的 内 容 合 一 ， 找 到 正确 的 替换 ， 让 两 个 表达 式 等 价 : 
(cl/run 1 [q] 


(cl/== [1 2 3] 
[1 2 q])) 





;; -> (3) 


(cl/run 1 [q] 
(cl/== ["foo" "bar" "baz"] 
[q "bar" "baz"])) 

;; -> ("foo") 
从 技术 上 说 ， 合 一 是 一 种 关系 ， 将 第 一 种 形式 与 第 二 种 形式 关联 起 来 。 这 是 core.logic 要 
解决 的 一 种 迷 题 。 在 前 面 的 例子 中 ，q 是 一 个 逻辑 变量 ，core.1logic 的 职责 是 将 一 个 值 与 
9q 绑 定 ， 让 合 一 〈clLojure.core.Logic/== 关系) 的 左边 和 右边 在 句法 上 是 等 价 的 。 如 果 疫 
有 绑 定 能 满足 这 个 迷 题 ， 解 决 方案 就 不 存在 : 

站 无 法 让 一 个 值 既是 1 又 是 2 

(cl/run 1 [q] 

















(cl/== 1 9) 
(cl/== 2 q)) 
;; -> () 


fresh 是 创建 更 多 逻辑 变量 的 一 种 方法 : 


(cl/run 1 [q] 
(cl/fresh [x y z] 


(cl/== x 1) 
(cl/== y 2) 
(cl/== z 3) 


(cl/== q [x y z]))) 
;; -> ([1 2 3]) 
正如 clojure.core.logic/== 是 两 种 形式 之 间 的 关系 ，clojure.core.logic/membero 是 列表 
中 的 元 素 与 列表 之 间 的 关系 : 


(cl/run 1 [q] 
(cl/membero q [1])) 


人 (1) 


(cl/run 1 [q] 
(cl/membero 1 q)) 


;; -> ((1 . _0)) 
第 一 个 例子 是 问 列表 [1] 中 的 所 有 成 员 ， 刚 好 只 有 1。 第 二 个 例子 正好 相反 ， 问 成 员 包含 1 
的 列表 。 圆 点 记号 表示 不 合适 的 尾部 ， 其 中 有 -09。 这 意味 着 1 可 以 自己 出 现在 列表 中 ,或 
者 后 面 跟着 一 串 其 他 数字 、 字 符 串 、 列 表 等 。_6 是 一 个 未 绑 定 的 变量 ， 因 为 除了 1 是 成 员 
外 ， 这 个 列表 没有 进一步 的 约束 。 























clojure.core.logic/run* 是 一 个 宏 ， 请 求 所 有 可 能 的 解决 方案 。 请 求 所 有 
包含 1 的 列表 将 无 法 结束 。 








合 一 也 能 用 clojure.core.logic/membero， 看 到 结构 内 部 : 


(cl/run 1 [q] 
(cl/membero [1 q 3] [[1 2 3] [4 5 6] [7 8 9]])) 
;; -> (2) 





逻辑 变量 的 生存 期 是 整个 程序 执行 过 程 ， 确 保 在 多 个 语句 中 使 用 同一 个 逻辑 变量 : 








(let [seq-a [["foo" 1 2] ["bar" 3 4] ["baz" 5 6]] 
seq-b [["foo" 9 8] ["bar" 7 6] ["baz" 5 4]]] 
(cl/run 1 [q] 

(cl/fresh [first-item middle-item last-a last-b] 
(cl/membero [first-item middle-item last-a] seq-a) 
(cl/membero [first-item middle-item last-b] seq-b) 
(cl/== q [Last-a Last-b])))) 

;; -> ([6 4]) 


前 面 的 例子 没有 指定 first-item， 只 是 它 对 seq-a 和 seq-b 来 说 应 该 是 一 样 的 。core. 
logic 用 提供 的 数据 将 值 绑 定 到 满足 约束 的 变量 。mitddte-iten 也 是 一 样 。 


在 这 个 基础 上 ， 我 们 可 以 遍历 解决 方案 中 描述 
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(cl/run 1 [director-name] 

(cl/fresh [studio film-coll film cast director] 
(cl/membero [studio :name "Newmarket Films"] graph) 
(cl/membero [studio :type :FilmStudio] graph) 
(cl/membero [studio :filmsCollection film-coll] graph) 


(cl/membero [film-coll :type :FilmCollection] graph) 
(cl/membero [film-coll :film film] graph) 


(cl/membero [film :type :Film] graph) 
(cl/membero [film :cast cast] graph) 


(cl/membero [cast :type :FilmCast] graph) 
(cl/membero [cast :director director] graph) 


(cl/membero [director :type :Person] graph) 
(cl/membero [director :name director-name] graph))) 
; -> ("Christopher Nolan") 


上 面 的 代码 和 最 初 的 解决 方案 之 间 有 一 点 小 差异 : 没有 用 clojure.core.logic/run* 请 求 所 
有 解决 方案 ， 而 是 用 了 clojure.core.logic/run 1。 对 于 查询 Newmarket Films 的 导演 ， 程 
序 有 多 个 答案 。 请 求 多 个 答案 就 会 返回 更 多 结 吉 果 ， 不 需要 改动 其 他 代码 。 











对 前 面 的 查询 稍 作 改 动 ， 就 会 明显 改变 结果 。 将 "Newmarket Films" 换 成 一 
个 新 的 、 未 绑 定 的 变量 ， 就 会 返回 所 有 工作 室 的 所 有 导演 。 如 果 愿 意 ， 也 可 
以 创建 宏 ， 来 减少 一 些 代码 重复 。 














关系 式 解 决 方案 对 这 个 问题 有 一 个 好 处 ， 就 是 能 从 一 些 值 生成 图 。 


(first 
(cl/run 1 [graph 


] 





(cl/fresh [studio film-coll film cast director] 

[studio :name "Newmarket Films"] graph) 
[studio :type :FilmStudio] graph) 

[studio :filmsCollection film-coll] graph) 


(cl/membero 
(cl/membero 
(cl/membero 


(cl/membero 
(cl/membero 


(cl/membero 
(cl/membero 


(cl/membero 
(cl/membero 


(cl/membero 
(cl/membero 


in a) 





对 于 小 型 的 图 ，membero 足够 快 。 大 型 的 图 会 有 性 能 问题 ， 因 为 core.logic 将 多 次 





[film-coll :type :FilmCollection] graph) 
[film-coll :film film] graph) 


[fiLLm 
[fiLLm 


[cast 
[cast 


:type :Film] graph) 
:cast cast] graph) 


:type :FilmCast] graph) 
:director director] graph) 


[director :type :Person] graph) 
[director :name "Baz"] graph)))) 
;; -> ([_0 :name "Newmarket Films"] 

pe [ 0 :type :FilmStudio] 

和 [0 :filmsCollection _1] 


遍历 列 


表 ， 找 到 这 些 元 素 。 利 用 clojure.core.logic/to-stream 和 一 些 基本 索引 ， 能 大 幅 提 高 查 


询 性 能 。 


参阅 


。 由 Daniel P. Friedman、William E. Byrd 和 Oleg Kiselyov 合 著 的 The Reasoned Schemer(MIT 


Press ) 。 


。 core.logic 的 维基 页 














面 (https://github.com/clojure/core.logic/wiki) 。 


。 miniKanren 的 网 站 (http://minikanren.org/) 了 
。 core.logic 的 代码 库 (https://github.com/clojure/core.logic)， 包 含 了 使 用 clojure.core. 
logic/to-strean 的 例子 。 





。 core.match (https:Wgithub.comy/clojure/core.match) ( 非 合 一 ) 的 匹配 库 , 有 一 些 类 似 的 原理 
3.12 节 “ 用 core.match 为 Clojure 表达 式 制作 解析 器 ”中 有 简单 描述 。 


3.14 演奏 儿歌 


作者 : Chris Ford 

















问题 
希望 编码 演奏 儿歌 ， 启 发 孩子 开始 编程 。 
解决 方案 


用 Overtone (https://github.com/overtone/overtone) 来 演奏 歌曲 。 


1 








在 开始 前 ， 请 将 [overtone "0.8.1"] 加 入 你 的 项 目 依赖 关系 中 ， 或 用 lein-try 开始 REPL : 


$ lein try overtone 


| 





F 始 先 定义 一 首 老 儿歌 的 旋律 : 
(require '[overtone.live :as overtone]) 
(defn note [timing pitch] {:time timing :pitch pitch}) 


(def melody 
(let [pitches 
[0606012 
Row, row, row your boat, 
1234 
; Gently down the stream, 
777444222000 
; (take 4 (repeat "merrily")) 
43210] 
; Life is but a dreaml! 
durations 
[1 1 2/3 1/3 1 
2/3 1/3 2/3 1/3 2 
1/3 1/3 1/3 1/3 1/3 1/3 1/3 1/3 1/3 1/3 1/3 1/3 
2/3 1/3 2/3 1/3 2] 
times (reductions + 0 durations)] 
(map note times pitches))) 


。 ID 。。 


melody 

;; -> ({:time 0, :pitch 0} ;Row, 
Pr {:time 1, :pitch 0} ;row, 
es {:time 2, :pitch 0} ;row 
;3 {:time 8/3, :pitch 1} ;your 
i {:time 3N, :pitch 2} ;boat 
2 本 


将 这 段 旋律 转换 成 具体 的 调 ， 即 用 代表 该 调 的 函数 转换 每 个 音符 的 音 高 : 


(defn where [k f notes] (map #(update-in % [k] f) notes)) 





(defn scale [intervaLs] (fn [degree] (appLy + (take degree intervals)))) 
(def major (scale [2 2 12 2 2 1])) 














注 5: 如 果 在 Linux 上 运行 Overtone， 有 一 些 另 外 的 安装 考虑 。 更 详细 的 安装 指导 ， 请 参见 Overtone 的 维 
基 页 面 (https://github.com/overtone/overtone/wiki#installation ) 。 





























广义 计算 | 147 


(defn from [n] (partial + n)) 
(def A (from 69)) 


(->> melody 

(where :pitch (comp A major))) 

;; -> ({:time 0, :pitch 69} ; Row， 
a {:time 1, :pitch 69} ; row, 
2 Se) 


将 这 段 旋律 转换 成 具体 的 拍子 ， 即 用 代表 拍子 的 函数 转换 每 个 音符 的 音 长 : 
(defn bpm [beats] (fn [beat] (/ (* beat 60 1000) beats))) 


(->> melody 
(where :time (comp (from (overtone/now)) (bpm 90)))) 
;; -> ({:time 1383316072169, :pitch 0} 
;; {:time 4149948218507/3，:pitch 0} 
i ee) 


现在 ， 定义 一 种 乐器 ， 用 它 来 演奏 这 段 旋律 。 下 面 例子 中 的 合成 乐器 是 一 个 简单 的 正弦 
波 ， 它 的 振幅 和 音 长 是 由 一 个 包 络 来 控制 的 : 


(require '[overtone.live :refer [definst Line sin-osc FREE midi->hz at]]) 





(definst beep [freq 440] 
(let [envelope (line 1 0 0.5 :action FREE)] 
(* envelope (sin-osc freq)))) 


(defn play [notes] 
(doseq [{ms :time midi :pitch} notes] 
(at ms (beep (midi->hz midi))))) 











;; 人 确保 扬声器 打开 …… 
(->> melody 
(where :pitch (comp A major)) 
(where :time (comp (from (overtone/now)) (bpm 90))) 
play) 
;; -> <music playing on your speakers> 


如 果 儿 歌 是 一 种 轮 唱 (round) ， 像 “Row, Row, Row Your Boat” 这 样 ， 可 以 用 它 来 自我 伴奏 : 








(defn round [beats notes] 
(concat notes (->> notes (where :time (from beats))))) 


(->> melody 
(round 4) 
(where :pitch (comp A major)) 
(where :time (comp (from (overtone/now)) (bpm 90))) 
play) 


音符 是 具有 一 定 音 高 、 延 续 一 段 时 间 的 声音 。 歌 曲 是 一 系列 音符 。 因 此 在 Clojure 中 ,我 





们 可 以 简单 地 将 音乐 表示 为 时 间 / 音 高 对 的 序列 。 这 种 表示 在 结构 上 与 西方 音乐 记 谱 法 非 
党 类似， 五 线 谱 上 的 圆 点 表示 一 段 时 间 ， 音 高 由 它 的 水 平和 垂直 位 置 来 决定 。 但 不 像 传统 
的 音乐 记 谱 法 ，Clojure 的 表示 可 以 由 函数 式 编程 技术 来 操纵 。 














西方 音乐 片段 ， 如 “Row, Row, Row Your Boat”， 不 是 由 任意 音 高 组 成 的 。 在 一 段 旋律 中 ， 
音符 通常 被 限定 在 所 有 可 能 音 高 的 一 个 子 集 中 ， 称 为 音阶 。 


这 里 采用 的 方法 ， 是 将 音 高 表示 为 整数 ， 表 示 它 们 出 现在 音阶 上 的 位 置 ， 称 为 度 。 所 以 ， 
9 度 表示 音阶 中 的 第 1 个 音 高 ，4 度 表示 音阶 中 的 第 5 个 音 高 。 


这 简化 了 旋律 的 描述 ， 因 为 我 们 不 用 担心 指定 的 音 高 会 跑 到 音阶 外 面 去 。 这 也 让 我 们 能 够 
选择 不 同 的 音阶 ， 而 不 用 重 写 旋律 。 


要 使 用 度 ， 就 需要 一 个 函数 ， 将 度 翻译 成 真正 的 音 高 。 因 为 “Row, Row, Row Your Boat” 
是 在 大 调 音 阶 ， 所 以 需要 一 个 国 数 来 表示 该 音阶 。 我 们 发 现 ， 在 主音 阶 中 ， 相 邻 两 个 音 高 
之 间距 离 两 个 位 置 或 一 个 位 置 (音乐 家 称 之 为 全 音 或 半音 )。 我 们 定义 了 名 为 major (大 
调 ) 的 函数 ， 它 接收 度 ， 输 出 它 所 表示 的 半音 。 

我 们 的 音 高 仍然 不 太 对 ， 因 为 它们 是 相对 于 这 个 片段 的 最 低音 符 的。 需要 建立 一 个 音乐 参 
考点 ， 用 于 解释 我 们 的 度 。A 调 常 被 乐队 用 作 参 孝 点 ， 所 以 我 们 用 它 作为 音乐 上 的 0 度 。 
换言之 ， 我 们 将 用 A 大 调 来 演奏 “Row, Row, Row Your Boat”， 现 在 0 度 就 表示 A。 


























注意 ， 可 以 简单 地 结合 针对 大 调和 针对 A 的 函数 ， 得 到 组 合 的 A 大 调 函 数 。 


对 时 间 也 需要 类 似 的 转换 。 每 个 音调 的 时 间 用 拍子 (beat) 来 表示 ， 但 我 们 需要 用 毫秒 来 
表示 。 我 们 可 以 用 当前 的 系统 时 间作 为 临时 参考 点 ， 意 味 着 这 个 片段 将 从 现在 开始 (而 不 
是 从 Unix 纪元 的 起 始 时 间 开 始 )。“Row, Row, Row Your Boat” 是 一 种 轮 唱 ， 这 意味 着 如 
果 作 为 它 自 己 的 伴唱 ， 离 开 一 定 的 拍子 ， 也 是 和 谐 的 。 作 为 额外 的 修饰 ， 我 们 提供 了 第 二 
个 版 本 的 旋律 ， 比 第 一 个 版 本 慢 4 拍 。 


我 们 建议 你 尝试 进行 一 些 调整 ， 可 以 改变 速度 ， 或 使 用 不 同 的 调 (提示 一 下 ， 小 调 的 全 音 
和 半音 模式 是 [2 1 2 2 1 2 2]) 

我 们 也 建议 你 思考 ， 如 何 用 这 种 方式 来 对 一 系列 事件 建 模 ， 应 用 于 其 他 领域 。 将 时 间 系 列 
表示 为 一 个 序列 ， 然 后 对 整个 序列 进行 转换 ， 用 这 种 思路 来 描述 问题 是 简单 的 、 灵 活 的 ， 
也 是 可 组 合 的 方式 。 


音乐 是 美妙 动人 的 。 它 也 很 适合 在 函数 式 编程 语言 中 建 模 。 希 望 你 的 孩子 也 同意 这 一 点 。 









































参阅 


。 Clojure 中 的 音乐 环境 Overtone (https:Wgithub.com/overtone/overtone ) 。 





第 4 章 


本 地 |/0 





4.0 简介 


在 前 面 几 章 中 ， 我 们 完成 了 大 量 的 工作 ， 但 是 显而易见 ， 它 们 必须 在 某 个 地 方 实际 派 上 用 
场 。 如 何 将 数据 输入 Clojure 程序 ? 更 重要 的 是 ， 如 何 输出 ?本 章 即 探讨 了 如 何在 本 地 计 
算 机 上 实现 输入 和 输出 ， 因 为 ， 这 就 是 大 多 数 应 用 程序 的 数据 能 派 上 用 场 的 地 方 。 














与 本 地 计算 机 通信 的 方式 和 媒介 有 很 多 种 。 我 们 与 什么 通信 ? 以 什么 方式 ?采用 什么 格 
式 ? 这 有 点 像 经 典 的 棋盘 游戏 “ 妙 探 寻 凶 ”(Clue) : 它 是 控制 台 上 作为 命令 行 参数 的 纯 文 
本 ? 还 是 文件 中 作为 配置 信息 的 Clojure 数据 ? 本章 将 探讨 文件 、 格 式 以 及 GUI 和 控制 台 
风格 的 应 用 等 等 。 




















虽然 不 可 能 列 出 所 有 的 组 合 ， 但 我 们 希望 本 音 能 给 你 留 下 深刻 的 印象 ， 让 你 了 解 各 种 可 
能 。Clojure 中 大 多 数 好 的 解决 方案 可 以 组 合 使 用 ， 这 很 方便 。 你 可 以 毫 不 费力 地 应 用 本 章 
中 的 各 种 实例 来 满足 你 的 需求 。 





4.1 写 入 STDOUT 和 STDERR 


作者 : Alan Busby 


问题 


希望 写 入 STDOUT 和 STDERR。 
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解决 方案 
默认 情况 下 ，print 和 printtLn 函数 将 传递 给 它们 的 内 容 输 出 到 STDOUT 


(printLn "This text will be printed to STDOUT.") 
;; *OUt* 
;; 这 上 段 文字 将 输出 到 STDOUT。 


(do 
(print "a") 
(print "b")) 
;; *OUt* 
;; ab 


将 *out* 绑 定 改 为 *err*， 以 便 输出 到 STDERR， 而 不 是 STDOUT: 


(binding [*out* x*err*] 
(println "Blew up!")) 


;; *err* 

;; Blew up!'\n 
BS VAN 
讨论 








STDERR 流 。 


Clojure 的 所 有 打印 函数 ， 如 print 和 printtn， 都 用 *out* 绑 定 作为 输出 目的 地 。 





在 Clojure 中 ，*out* 和 *err* 是 动态 绑 定 的 var， 分 别 对 应 于 应 用 环境 内 建 的 STDOUT 和 





因此 ， 


可 以 将 它 重 新 绑 定 到 *err* (利用 binding)， 从 而 将 打印 信息 的 目的 地 从 STDOUT 改 为 





STDERR。 其 他 打印 国 数 包 括 pr、prn、printf ， 以 及 另外 几 种 。 


*out* 绑 定 的 值 不 限于 操作 系统 的 流 ，*out* 可 以 是 任何 类 似 流 的 对 象 。 这 让 打印 函数 变 得 
非常 强大 。 它 们 可 以 输出 到 文件 、 套 接 字 ， 或 任何 其 他 管道 。 内 建 的 函数 clojure.java. 








io/writer 是 多 功能 的 输出 流 构 造 器 : 
;; 创建 一 个 writer， 指 向 文件 foo.txt， 并 输出 到 该 文件 
(def foo-file (clojure.java.io/writer "foo.txt")) 
(binding [*out* foo-file] 
(println "Foo, bar.")) 
;; 没有 什么 输出 到 原来 的 *out* 
;; 当然 ， 要 关闭 该 文件 


(.close foo-file) 


阅 





Wp 


pr 的 文档 (http://clojure.github.io/clojure/clojure.core-api.html#clojure.core/pr) 和 源 代 码 


(https://github.com/clojure/clojure/blob/c6756a8bab137128c8119add29a25b0a88509900/src/ 











clj/clojure/core.clj#L3325)， 以 便 更 好 地 理解 基于 *out* 输出 的 原理 。 
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。 clojure.java.io/writer 的 文档 (http://clojure.github.io/clojure/clojure.java.io-api.html#clo 
jure.java.io/writer) ， 了 解 创建 writer 对 象 的 更 多 信息 。 


4.2 ”从 控制 台 读 入 一 次 击 键 


作者 : John Jacobsen 





问题 
通过 stdin 的 控制 台 输 入 通常 是 按 行 缓冲 的 ， 但 你 可 能 会 希望 从 控制 台 读 入 一 次 击 键 ， 不 
要 缓冲 。 


解决 方案 

利用 JLine 库 (https://github.com/jline/jline2) 的 ConsoLeReader， 这 个 Java 库 负责 处 理 控制 
台 输 入 

口 恒 和 八 。 























JLine 类 似 于 BSD 的 editline 和 GNU 的 readline。 要 继续 这 个 实例 ， 请 用 Letn new keystroke 
创建 一 个 新 库 。 在 project.clj 中 ， 将 [jLine "2.11"] 添加 到 :dependencies 向 量 中 。 





在 文件 src/keystroke/core.clj 中 ， 利 用 ConsoleReader ， 从 终端 读 取 字 符 : 


(ns keystroke.core 
(:import [jline.console ConsoLeReader])) 


(defn show-keystroke [] 
(print "Enter a keystroke: ") 
(flush) 
(let [cr (ConsoleReader.) 
keyint (.readCharacter cr)] 
(println (format "Got %d ('%c')!" keyint (char keyint))))) 


讨论 

像 大 多 数 语言 一 样 ，Java 中 的 控制 台 VO 是 有 缓冲 的 ，flush 将 最 初 的 命令 写 入 标准 
输出 流 。 但 是 ， 输 入 默认 也 是 有 缓冲 的 。JLine 库 提 供 了 ConsoleReader 对 象 ， 它 的 
readCharacter 方法 可 以 避免 输入 缓冲 。 但 是 ， 在 REPL 中 测试 show-keystroke 时 要 谨慎 : 





$ lein repl 

user=> (require '[keystroke.core :refer [show-keystroke]]) 
User=> (show-keystroke) 

Enter a keystroke: 

;; HANGS! 





为 了 将 控制 台 输 入 正确 地 连接 到 REPL， 请 使 用 lein trampoline repl (这 里 的 <r> 表示 





用 户 输入 了 字母 r) : 


$ lein trampoline repl 

User=> (require '[keystroke.core :refer [show-keystroke]]) 

User=> (show-keystroke) 

Enter a keystroke: <r>Got 114 ('r')! 

nil 

User=> 
lein trampoline 是 必需 的 ， 因 为 默认 情况 下 ，Leiningen 实际 上 是 在 另 一 个 JVM 进程 中 运 
行 REPL 及 其 相关 的 控制 台 MO， 与 你 的 代码 不 同 。tranpotine 选项 强制 Leiningen 在 同一 
个 进程 中 运行 REPL 和 你 的 代码 ， 像 “ 跳 蹦床 ”一 样 来 回 切 换 控 制 。 通 常 这 是 看 不 见 的 ， 
但 是 如 果 执 行 的 代码 希望 直接 使 用 控制 台 ， 就 会 有 问题 。 


如 果 在 REPL 之 外 执行 你 的 程序 (就 像 通 常 那样 


是 问题 。 





























运行 Clojure 写 的 命令 行 应 用 ) ， 这 就 不 





参阅 
。 如 果 想 要 更 丰富 的 、 基 于 终端 的 界面 ， 像 C 的 curses 库 提供 的 那样 ， 那 么 clojure-Lanterna 
(http://sjl.bitbucket.org/clojure-lanterna/) 库 是 个 不 错 的 起 点 。 


4.3 执行 系统 命令 


作者 : Mark Whelan 和 Ryan Neufeld 








问题 
希望 向 底层 的 操作 系统 发 出 一 个 命令 ， 并 获得 其 输出 。 
解决 方案 


利用 ctlj-commons-exec 库 ， 在 本 地 操作 系统 上 执行 shell 命令 。 

















要 继续 本 实例 ， 请 用 lein-try 开始 REPL : 
$ lein try org.clojars.hozumi/clj-commons-exec "1.0.6" 


调用 clj-commons-exec/exec 国 数 ， 带 上 要 执行 的 命令 ， 将 返回 一 个 promise 对 象 ， 最 
终 得 到 一 个 映射 表 ， 包 含 命令 的 输出 、 退 出 状态 ， 以 及 任何 发 生 的 错误 〈 分 别 对 应 
于 :out、:exit 和 :err 键 ) : 











(require '[clj-commons-exec :as exec]) 
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(def p (exec/sh ["date"])) 


(deref p) 
;; -> {:exit 0, :out "Sun Dec 1 19:43:49 EST 2013\n", :err nil} 





如 果 命 令 需 要 带 选 项 或 参数 ， 只 要 将 它们 作为 字符 串 ， 附 加 在 命令 向 量 中 : 








@(exec/sh ["ls" "-l" "/etc/passwd"]) 

;; -> {:exit 0 

fe :OUt "-rw-r--r-- 1 root wheel 4962 May 27 07:54 /etc/passwd\n" 
2 :err nil} 


@(exec/sh ["ls" "-l" "nosuchfile"]) 
;; -> {:exit 1 


:out niL 

Ss :err "ls: nosuchfile: No such file or directory\n" 

总 :exception #<ExecuteException ... Process exited with an error: 1 .. 
4 * 八 
讨论 


到 目前 为 止 ,我们 并 没有 提 到 ，Clojure 本 身 已 经 包含 了 与 exec/sh 相同 的 功能 





.)>} 


(作为 


clojure.java.shell/sh)。 读 者 肯定 会 问 : 既然 如 此 ， 为 什么 要 使 用 外 部 的 库 ， 而 不 是 
内 建 的 功能 ?答案 很 简单 : clj-commons-exec 是 优秀 的 Apache Commons Exec 库 (http:// 
commons.apache.org/proper/commons-exec/) 的 函数 式 封 装 ， 提 供 了 像 管 道 这 样 的 clojure. 




















java.sh 不 提供 的 功能 。 








要 在 多 个 命令 之 间 利 用 管道 传递 数据 ， 就 使 用 clj-commons-exec/sh-pipe 函数 。 就 像 常 规 
的 Unix 管道 那样 ， 成 对 命令 的 STDOUT 和 STDIN 流 绑 定 在 一 起 。sh-pipe 的 API 几乎 和 sh 
样 ， 唯 一 的 不 同 是 可 以 向 sh-pipe 传递 多 个 命令 。sh-pipe 的 返回 值 是 promise 对 象 的 列 























表 ， 它 们 在 每 个 子 命令 执行 完成 时 得 到 填充 : 


(def results (exec/sh-pipe ["cat"] ["wc" "-w"] {:in "Hello, world!"})) 


results 

;; -> (#<core$promise$reify 6310@71eed8d: {:exit 0, :out nil, :err nil}> 
2 #<core$promises$reify 6310@7f7dc7al: {:exit 0， 

人 :out " 2\n", 

ps :err nil}>) 


@(last results) 
;; -> {:exit 0, :out " 2\n", :err nil} 











像 所 有 合理 的 命令 处 理 库 一 样 ，clj-commons-exec 允许 配置 命令 执行 的 环境 。 要 控制 sh 或 




















sh-pipe 的 执行 环境 ， 就 要 在 一 个 映射 表 中 指定 选项 ， 作 为 这 两 个 函数 的 最 终 参 
选项 控制 了 命令 执行 的 路 径 : 


(println (:out @(exec/sh ["ls"] {:dir "/"}))) 
OU 


数 。:dir 





Applications 
Library 

# ... 

usr 

var 


:env 和 :add-env 选项 控制 一 些 环境 变量 ， 提 供给 要 执行 的 命令 。:add-env 将 变量 附 在 原 
有 的 环境 变量 后 面 ， 而 :env 将 完全 取代 原 有 的 环境 变量 。 每 个 选项 都 是 一 个 映射 表 ， 包 含 
变量 名 和 值 ， 就 像 {"USER" "jeff"}: 














@(exec/sh ["printenv" "HOME"]) 
;; -> {:exit 0, :out "/Users/ryan\n", :err nil} 


@(exec/sh ["printenv" "HOME"] {:env {}}) 
;; -> {:exit 1, :out nil, :err nil, :exception #<ExecuteException ..)>} 


@(exec/sh ["printenv" "HOME"] {:env {"HOME" "/Users/jeff"}}) 
;; -> {:exit 0, :out "/Users/jeff\n", :err nil} 


sh 和 sh-pipe 还 可 以 使 用 其 他 一 些 选 项 : 
:watchdog 
在 终止 命令 之 前 ， 等 待命 令 执 行 完成 的 秒 数 。 


:shutdown 


一 个 标志 ， 表 明子 进程 应 该 在 VM 退出 时 销毁 。 





* 司 SSUECeSS 和 :dS-SuCCesses 


一 个 整数 或 整数 序列 ， 它 们 将 被 视 为 成 功 的 退出 码 ， 分 别 对 应 每 个 命令 


o 


:result-handler-fn 





一 个 定制 的 函数 ， 用 于 处 理 结果 。 








如 果 在 -main 函数 中 发 起 长 时 间 的 子 进程 ， 应 用 将 挂 起 ， 直 到 这 些 进程 完 
成 。 如 果 不 想 这 样 ， 就 在 -main 函数 的 末尾 直接 调用 (System/exit)， 强 制 
终止 你 的 应 用 。 而 且 ， 对 所 有 子 进程 ， 将 :shutdown 设 为 true， 确 保 系 统 干 
净 整 洁 ， 没 有 恶意 进程 。 











要 检查 子 进程 是 否 已 经 返回 ， 又 不 想 等 到 结束 ， 就 对 sh 返回 的 promise 对 象 调 用 
realized? 国 数 (对 于 监控 sh-pipe 返回 的 promise 对 象 序列 的 进展 ， 这 尤其 有 用 ) : 




















;; 任何 运行 时 间 长 的 命令 
(def p (exec/sh ["sleep" "5"])) 
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(realized? p) 
;; -> false 


;; 儿 秒 钟 后 …… 
(realized? p) 
;; -> true 


Sh 


阅 
。 如 果 不 需 要 管道 或 clj-common-execs 的 高 级 功能 ,请 萎 虑 使 用 clojure.java.shell(http:// 


clojure.github.io/clojure/clojure.java.shell-api.html ) 。 


4.4 ”访问 资源 文件 

作者 : John Jacobsen，John Cromartie 和 Alex Petrov 提供 了 帮助 
问题 

在 Clojure 项 目 中 ， 和 希望 从 classpath 中 包含 一 个 资源 文件 。 
解决 方案 


将 资源 文件 放 在 Leiningen 项 目 顶层 目录 的 resources/ 目录 下 。 要 继续 这 个 实例 ， 先 用 Lein 
new people 命令 创建 一 个 新 项 目 。 


让 











例如 ， 假 定 文件 resources/people.edn 包含 下 面 的 内 容 : 











[{:first-name "John"，:Last-name "McCarthy", :language "Lisp"} 
{:first-name "Guido", :last-name "Van Rossum", :language "Python"} 
{:first-name "Rich", :last-name "Hickey", :language "Clojure"}] 





将 文件 名 称 (与 resources 目录 对 应 ) 传递 给 clojure.java.io/resource 畏 数 ， 得 到 一 个 
java.io.File 实例 ， 然 后 可 以 自由 读 取 (例如 使 用 sLurp 函数 ) : 








(require '[clojure.java.io :as io] 
'[clojure.edn :as edn]) 


(->> "people.edn" 
io/resource 
slurp 
edn/read-string 
(map :language)) 
;; -> ("Lisp" "Python" "Clojure") 





讨论 
资源 通常 用 于 保存 各 种 文件 ， 它 们 在 逻辑 上 是 应 用 的 一 部 分 ， 但 不 是 代码 ， 


资源 是 通过 Java 的 classpath 加 载 的 ， 就 像 Clojure 代码 一 样 。 在 启动 Java 进程 时 ， 
Leiningen 自动 将 resources/ 目录 放 到 classpath 中 。 在 打包 时 ，resources/ 的 内 容 会 复制 到 生 
成 的 JAR 文件 的 根 目录 中 。 


也 可 以 在 project.clj 文件 中 使 用 :resources-paths 键 ， 指 定 另 一 个 (或 附加 的 ) 资源 目录 : 











:resource-paths ["my-resources" "src/other-resources"] 





使 用 基于 classpath 的 资源 非常 方便 ， 但 也 确实 有 一 些 缺 点 。 


要 注意 ， 在 Web 应 用 的 环境 中 ， 对 资源 的 任何 改动 都 可 能 导致 全 面 的 重新 部 署 ， 因 为 它们 
全 部 包含 在 部 署 的 JAR 和 WAR 文件 中 。 通 常 ， 这 意味 着 最 好 只 在 内 容 完全 静态 时 ， 才 使 
用 资源 文件 。 例 如 ， 尽 管 可 以 将 应 用 的 配置 文件 放 在 resources/ 目录 下 ， 并 从 这 个 目录 加 
载 ， 但 这 样 做 实际 上 是 将 它们 作为 应 用 源 代码 的 一 部 分 ， 并 不 适合 它们 的 目的 。 对 于 〈 相 
对 ) 频繁 改动 的 资源 ， 你 可 能 希望 将 它们 放 在 文件 系统 中 某 个 已 知 的 位 置 ， 从 那里 加 载 ， 
而 不 是 利用 classpath 。 


有 时 候 不 使 用 classpath 还 有 其 他 的 原因 。 例 如 ， 考 虑 网 站 的 静态 图 片 ， 如 果 将 它们 放 在 
Web 应 用 的 classpath 中 ， 它 们 将 由 应 用 服务 器 容器 (Jetty、Tomcat、JBoss 等 ) 来 提供 。 
通常 ， 这 些 应 用 是 为 提供 动态 HTML 内 容 ， 而 不 是 为 较 大 的 二 进 制 文件 而 优化 的 。 提 供 较 
大 的 静态 文件 ， 一 般 更 适合 让 架构 中 的 HTTP 服务 器 来 完成 ， 而 不 是 应 用 服务 器 ， 所 以 应 
该 代理 给 Apache、Nsginx， 或 你 用 的 其 他 HTTP 服务 器 。 或 者 ， 你 甚至 可 能 希望 将 它们 分 
割 开 ， 完 全 通过 一 种 独立 的 机 制 来 提供 它们 ， 例 如 内 容 分 发 网 络 (CDN)。 在 这 两 种 情况 
下 ， 很 难 让 HTTP 服务 器 或 CDN 从 应 用 的 JAR 文件 中 取出 资源 ， 所 以 最 好 是 从 一 开始 就 
将 它们 分 开 存 储 。 














































































































参阅 

。 Leiningen 的 sample.project.clj (https://github.com/technomancy/leiningen/blob/41f7a 
297b4daf4b3676048b5172a9c80c89e9266/sample.project.clj#L247)， 其 中 更 详细 地 描述 
了 :resource-paths 选项 的 工作 原理 。 

。 4.14 节 “ 读 写 Clojure 数据 ”。 


4.5 复制 文件 


作者 : Stefan Karlsson 
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问题 
需要 复制 本 地 文件 系统 的 一 个 文件 。 


解决 方案 
调用 cLojure.java.tio/copy， 传 入 源 文件 和 目标 文件 ; 


(clojure.java.io/copy 
(clojure.java.io/file "./file-to-copy.txt") 
(clojure.java.io/file "./my-new-copy.txt")) 
;; -> nil 


如 果 输 入 文件 没 找到 ， 会 抛 出 java.io.FileNotFoundException: 


(clojure.java.io/copy 
(clojure.java.io/file "./file-do-not-exist.txt") 
(clojure.java.io/file "./my-new-copy.txt")) 

;; -> java.io.FileNotFoundException 





Hd 


copy 的 输入 参数 不 一 定 是 文件 ， 也 可 以 是 InputStream、Reader、 字 市 数字 或 字符 上 
样 就 很 容易 将 正在 处 理 的 数据 直接 复制 到 输出 文件 : 





(clojure.java.io/copy "some text" (clojure.java.io/file "./str-test.txt")) 
;; -> nil 


如 果 需 要 ， 可 以 通过 :encoding 选项 指定 编码 方式 : 





(clojure.java.io/copy "some text" 
(clojure.java.io/file "./str-test.txt") 
:encoding "UTF-8") 


讨论 
请 注意 ， 如 果 文 件 已 经 存在 ， 它 将 被 覆 写 。 如 果 不 希望 这 样 ， 可 以 编写 一 个 “安全 ”复制 
函数 ， 它 会 捕捉 所 有 异常 ， 并 利用 可 选 的 参数 实现 履 写 




















(defn safe-copy [source-path destination-path & opts] 
(Let [source (clojure.java.io/file source-path) 
destination (clojure.java.io/file destination-path) 
options (merge {:overwrite false} (apply hash-map opts))] ; © 
(if (and (.exists source) ;© 
(or (:overwrite options) 
(= false (.exists destination)))) 


(try 
(= nil (clojure.java.io/copy source destination)) ;© 
(catch Exception e (str "exception: " (.getMessage e)))) 
false))) 





(safe-copy "./file-to-copy.txt" "./my-new-copy.txt") 

;; -> true 

(safe-copy "./file-to-copy.txt" "./my-new-copy.txt") 

;; -> false 

(safe-copy "./file-to-copy.txt" "./my-new-copy.txt" :overwrite true) 
;; -> true 


safe-copy 函数 接受 源 文 件 和 目标 文件 的 路 径 ， 从 源 复 制 到 目标 。 它 也 接受 一 些 键 / 值 对 作 

为 选项 。 

@ 然后 这 些 选项 与 默认 值 合 并 。 在 这 个 例子 中 ， 只 有 一 个 选项 :overwrite， 但 利用 这 个 
可 选 参 数 的 结构 ， 很 容易 添加 自己 的 选项 (例如 在 需要 时 添加 :encoding)。 

@ 在 选项 被 处 理 之 后 ， 该 函数 检查 目标 文件 是 否 已 存在 ， 如 果 存 在 ， 是 否 应 该 履 写 。 如 

果 一 切 正常 ， 它 会 在 try-catch 语句 块 中 执行 copy。 

@ 在 文件 复制 时 ， 要 注意 对 结果 等 于 nil 的 检查 。 如 果 加 上 检查 ， 就 能 确保 该 函数 返回 
Boolean 值 。 这 会 使 函数 用 起 来 更 方便 ， 因 为 可 以 判断 操作 是 否 成 功 。 








I 

































































也 可 以 用 java.io.Reader 和 java.io.Writer 作为 参数 ， 来 调用 clojure.java.io/copy， 还 
可 以 用 流 作为 参数 : 
(with-open [reader (clojure.java.io/reader "file-to-copy.txt") 
writer (clojure.java.io/writer "my-new-copy.txt")] 
(clojure.java.io/copy reader writer)) 
在 选择 File、Reader 、Writer 或 流 作 为 输入 和 输出 源 时 ， 需 要 考虑 效率 ， 这 也 同样 适用 于 
copy。 更 多 信息 ， 请 参见 4.9 市 。 








默认 情况 下 ， 在 调用 copy 时 使 用 1024 字 市 的 缓冲 区 。 这 是 一 次 从 源 读 取 并 写 入 目标 的 数 
据 量 。 这 样 一 直 进 行 到 源 被 完整 复制 为 止 。 缓 冲 区 大 小 可 以 通过 :buffer-size 选项 来 更 
改 。 采 用 较 小 的 数字 将 导致 文件 访问 操作 更 多 ， 但 在 内 存 中 保留 较 少 的 数据 。 相 反 ， 增 大 
缓冲 区 将 减少 文件 访问 的 次 数 ， 但 需要 将 更 多 的 数据 加 载 到 内 存 中 。 








参阅 


。 clojure.java.io 的 API 文档 (http://clojure.github.io/clojure/clojure.java.io-api.html) 。 


4.6 ”删除 文件 或 目录 


作者 : Stefan Karlsson 





问题 
需要 从 本 地 文件 系统 中 删除 一 个 文件 。 
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解决 方案 
使 用 clojure.java.io/delete-file 来 删除 文件 : 


(clojure.java.io/delete-file "./file-to-delete.txt") 
;; -> true 


如 有 果 演 试 删除 一 个 不 存在 的 文件 ， 就 会 抛 出 java.to.IOException: 





(clojure.java.io/delete-file "./file-that-does-not-exist.txt") 
;; -> java.io.IOException: Couldn't delete 




















如 果 给 定 的 文件 因为 某 种 原因 不 能 删除 ， 又 不 希望 delete-file 抛 出 异常 ， 那 么 可 以 将 参 
数 中 的 silently 标志 设置 为 true: 


(clojure.java.io/delete-file "./file-that-does-not-exist.txt" true) 
;; -> true 


讨论 
如 果 你 有 时 需要 对 可 能 的 异常 做 一 些 定制 的 处 理工 作 ， 那 就 应 该 将 detete-fite 的 调用 放 
在 try-catch 语句 块 中 ， 

















(try 
(clojure.java.io/delete-file "./file-that-does-not-exist.txt") 
(catch Exception e (str "exception: " (.getMessage e)))) 


;; -> "exception: Couldn't delete ./file-that-does-not-exist.txt" 


java.io.File 有 一 个 .exists 属性 ， 它 是 一 个 Boolean 值 ， 表 明文 件 是 否 存在 。 你 可 以 利 
用 这 个 属性 和 try-catch 语句 块 ， 得 到 “安全 ”的 删除 函数 。 这 个 函数 先 检 查 参 数 中 指定 
的 带路 径 的 文件 是 否 存在 ， 然 后 再 尝试 删除 它 : 





(defn safe-delete [file-path] 
(if (.exists (clojure.java.io/file file-path)) 


(try 

(clojure.java.io/delete-file file-path) 

(catch Exception e (str "exception: " (.getMessage e)))) 
false)) 


(safe-delete "./file-that-does-not-exist.txt") 
;; -> false 

(safe-delete "./file-to-delete.txt") 

;; -> true 


也 可 以 用 clojure.java.io/delete-file 国 数 来 删除 目录 。 目 录 必 须 是 空 的 才能 成 功 删除 ， 
所 以 删除 目录 的 工具 函数 必须 先 删除 该 目录 下 的 所 有 文件 : 


(clojure.java.io/delete-file "./dir-to-delete") 
;; -> false 





(defn delete-directory [directory-path] 
(let [directory-contents (file-seq (clojure.java.io/file directory-path)) 
files-to-delete (filter #(.isFile %) directory-contents)] 
(doseq [file files-to-delete] 
(safe-delete (.getPath file))) 
(safe-delete directory-path))) 


(delete-directory "./dir-to-delete") 
;; -> true 


delete-directory 将 得 到 一 个 file-seq， 其 中 包含 指定 路 径 下 的 内 容 。 然 后 它 过 滤 出 该 目 
录 下 的 文件 ， 接 下 来 删除 所 有 文件 ， 最 后 是 删除 目录 本 身 。 请 注意 对 doall 的 调用 。 如 果 
不 调用 doatl， 文件 的 删除 将 是 惰性 的 ， 所 以 在 删除 目录 时 ， 文 件 仍然 存在 ， 这 样 调用 就 
会 失败 。 


参阅 
。 clojure.java.io 的 API 文 档 (http://clojure.github.io/clojure/clojure.java.io-api.html) 。 
。 4.7 节 “ 列 出 目录 中 的 文件 ”， 更 详细 地 探讨 了 利用 file-seq 来 取得 目录 中 的 文件 。 


4.7” 列 出 目录 中 的 文件 


作者 : Ryan Neufeld 和 Stefan Karlsson 











问题 
给 定 一 个 目录 ， 和 希望 访问 其 中 的 文件 。 
解决 方案 


调用 内 建 的 file-seq 函数 。 








要 继续 这 个 实例 ， 先 利用 以 下 命令 ， 创 建 一 些 样本 文件 和 目录 (在 Linux 或 
Mac 中 ) : 








$ mkdir -p next-gen 
$ touch next-gen/picard.jpg next-gen/Locutus .bmp next-gen/data.txt 


file-seq 返回 一 个 java.io.File 对 象 的 惰性 序列 : 





(def tng-dir (file-seq (clojure.java.io/file "./next-gen"))) 


tng-dir 
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; -> (#<File ./next-gen> 


~ 


eS #<File ./next-gen/picard.jpg> 
2 #<File  ./next-gen/Locutus .bmp> 
#<File ./next-gen/data.txt>) 

外 * 八 

讨论 





序列 是 Clojure 的 强大 抽象 之 一 。 将 目录 层级 作为 一 个 序列 ， 就 可 以 利用 map 和 fitter 这 
样 的 函数 来 操纵 文件 和 目录 。 





例如 ， 假 设 只 想 选 择 目 录 层 级 中 的 文件 (不 包含 目录 )。 你 可 以 定义 一 个 函数 ， 取 得 文件 
和 目录 的 序列 ， 并 用 java.io.File 对 象 的 .isFile 属性 对 它们 进行 过 滤 : 














(defn only-files 
"Filter a sequence of files/directories by the .isFile property of 
java.io.File" 
[file-s] 
(filter #(.isFile %) file-s)) 


(only-files tng-dir) 

;; -> (#<File ./next-gen/data.txt> 

2 #<File ./next-gen/Locutus .bmp> 
2 #<File ./next-gen/picard.jpg>) 


如 果 想 显示 所 有 文件 的 名 称 呢 ? 定义 一 个 names 函数 ， 对 文件 序列 映射 .getName 属性 ， 然 
后 组 合 使 用 only-files 和 names， 得 到 目录 下 的 文件 名 列表 : 








(defn names 
"Return the .getName property of a sequence of files" 
[file-s] 
(map #(.getName %) file-s)) 


(-> tng-dir 
only-files 
names) 
;; -> ("data.txt" "locutus.bmp 


picard.jpg") 


阅 

File 类 的 文档 (http://docs.oracle.com/javase/7/docs/api/java/io/File.html)， 了 人 解 File 对 象 
的 属性 和 方法 的 完整 列表 。 

将 这 些 技术 与 一 些 工具 库 结合 , 如 Google Guava 的 Files 类 (http://docs.guava-libraries. 
googlecode.com/gitjavadoc/com/google/common/io/Files.html) 或 Apache Commons 的 FilenameUtils 


. Ns 





类 (http://commons.apache.org/proper/commons-io/javadocs/api-1.4/org/apache/commons/io/ 


FilenameUtils.html) ， 从 文件 的 序列 抽象 中 得 到 更 大 的 好 处 。 





4.8 文件 的 内 存 映 射 


作者 : Alan Busby 


问题 

希望 用 内 存 映射 来 访问 大 文件 ， 就 像 它 完全 载 和 内存 一 样 ， 但 实际 上 没有 加 载 整 个 文件 。 
解决 方案 

利用 clj-mmap 库 (https://github.com/thebusby/cljj-mmap)， 它 包装 了 Java 的 NIO (新 10) 
库 的 内 存 映 射 功能 。 











开始 之 前 ， 请 在 项 目 依 赖 关系 中 加 入 [clj-mmap "1.1.2"]， 或 用 lein-try 开始 REPL: 
$ lein try clj-mmap 

要 读 取 UTF-8 编码 的 文本 文件 的 开头 和 末尾 N 个 字 节 ， 请 用 get-bytes 函数 : 

(require '[clj-mmap :as mmap]) 


(with-open [file (mmap/get-mmap "/path/to/file/file.txt")] 
(let [n-bytes 10 
file-size (.size file) 
first-n-bytes (mmap/get-bytes file 0 n-bytes) 
last-n-bytes (mmap/get-bytes file (- file-size n-bytes) n-bytes)] 
[(String. first-n-bytes "UTF-8") 
(String. last-n-bytes "UTF-8")])) 


要 种 写 文本 文件 开头 N 个 字 节 ， 请 用 put-bytes: 





(with-open [file (mmap/get-mmap "/path/to/file/file.txt")] 
(let [bytes-to-write (.getBytes "New text goes here" "UTF-8") 
file-size (.size file)] 
(if (> file-size 
(alength bytes-to-write)) 
(mmap/put-bytes file bytes-to-write 0)))) 


讨论 
内 存 映 射 或 POSIX 标准 的 mmap， 是 利用 操作 系统 的 虚拟 内 存 来 进行 文件 IO 的 方法 。 通 
过 将 文件 映射 到 应 用 的 内 存 空间 ， 缓 冲 区 之 间 的 复制 行为 减少 了 ，L/O 性 能 增加 了 。 


内 存 映 射 的 文件 对 于 大 文件 、 结 构 化 的 二 进 制 文件 尤其 有 用 ， 对 于 文本 文件 避免 Java 的 
String 开销 也 很 有 用 。 
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虽然 Clojure 可 以 方便 地 直接 调用 Java NIO 的 功能 ， 但 NIO 在 处 理 超 过 2GB 的 文件 时 特 
别 困 难 。cUj-mmap 封装 了 这 种 复杂 性 ， 但 它 没 有 提供 NIO 的 全 部 功能 。 在 需要 的 时 候 ， 仍 
可 以 通过 互 操作 性 来 调用 NIO Java API。 




















参阅 
。 mmap 的 维基 百科 页 面 (http:/en.wikipedia.org/wiki/Mmap ) 。 
。 clj-mmap 的 GitHub 代码 库 (https://github.com/thebusby/clj-mmap)。 


4.9 读 写 文本 文件 


作者 : Stefan Karlsson 

















问题 
希望 读 写本 地 文件 系统 中 的 文本 文件 。 


解决 方案 
用 内 建 的 sptt 函数 将 字符 串 写 人 文件 : 








(spit "stuff.txt" "my stuff") 


用 内 建 的 sturp 函数 读 取 文 件 的 内 容 : 


(slurp "stuff.txt") 
;; -> "all my stuff" 


如 果 需 要 ， 可 以 利用 :encoding 选项 来 指定 编码 方式 : 


(slurp "stuff.txt" :encoding "UTF-8") 
;; -> "all my stuff" 














用 spit 函数 的 :append true 选项 ， 将 数据 添加 到 已 有 文件 的 后 


TI 


(spit "stuff.txt" "even more stuff" :append true) 
要 一 行 一 行 地 读 取 文 件 ， 而 不 是 一 次 将 所 有 内 容 装 入 内 存 ， 请 使 用 java.io.Reader 和 
line-seq 国 数 : 

(with-open [r (clojure.java.io/reader "stuff.txt")] 


(doseq [line (line-seq r)] 
(println line))) 


要 将 大 量 的 数据 写 入 文件 ， 又 不 想 将 数据 变 成 一 个 字符 串 ， 请 使 用 java.io.writer: 








(with-open [w (clojure.java.io/writer "stuff.txt")] 
(doseq [line some-large-seq-of-strings] 
(.write w line) 
(.newLine w))) 


讨论 
如 果 使 用 :append， 文 本 将 添加 在 文件 末尾 。 要 打印 的 字符 串 加 上 "\n"， 在 每 行 末 加 上 换 
行 。 文 本 文件 中 所 有 行 末 都 要 有 换行 ， 包 括 最 后 一 行 : 





(defn spitn 
"Append to file with newline" 
[path text] 
(spit path (str text "\n") :append true) 











spit 和 stLurp 与 字符 串 一 起 使 用 ， 实 现 一 次 性 处 理 文件 的 全 部 内 容 ， 并 在 读 写 完成 后 关闭 
文件 。 如 果 需 要 读 写 很 多 数据 ， 使 用 流 式 API 更 有 效 (在 内 存 和 时 间 方 面 )， 比 如 java. 
io.Reader 或 java.io.Writer， 因 为 它们 不 需要 在 内 存 中 重新 实现 文件 的 内 容 。 











但 是 ， 如 果 使 用 writer 对 象 和 流 ， 有 一 点 很 重要 : 即 清空 所 有 writer 对 象 ， 写 入 底层 的 流 ， 
以 确保 数据 真正 写 入 ， 资 源 得 到 释放 。with-open 宏 在 执行 完 它 的 内 容 后 ， 将 清空 并 关闭 
它 绑 定 的 流 。 























尤其 要 注意 ， 如 果 基 于 流 的 惰性 序列 在 序列 实现 之 前 ， 底 层 的 流 被 关闭 了 ， 
它 将 抛 出 错误 。 甚 至 在 使 用 with-open 时 ， 也 有 可 能 返回 未 实现 的 惰性 序 
列 ，with-open 宏 无 法 知道 流 仍 需 要 打开 ， 所 以 不 管 怎样 都 会 关闭 流 ， 导 致 
序列 无 法 实现 。 














一 般 来 说 ， 最 好 不 要 让 基于 疲 的 惰性 序列 超出 流 打 开 的 代码 范围 。 如 果 一 定 要 这 样 做 ， 
必须 非常 小 心 ， 只 要 惰性 序列 还 需要 读 取 ， 就 要 确保 实现 惰性 序列 所 需 的 资源 一 直 打 开 。 
通常 ， 这 样 做 需要 手工 记录 哪些 流 仍然 打开 ， 而 不 是 依赖 于 try/finally 或 with-open 
代码 块 。 





参阅 

。 4.14 节 “ 读 写 Clojure 数据 ”。 

。 java.io.Reader (http://docs.oracle.com/javase/7/docs/api/java/io/Reader.html) 和 java.io.Writer 
(http://docs.oracle.com/javase/7/docs/api/java/io/Writer.html) 的 文档 。 


4.10 使 用 临时 文件 


作者 : Alan Busby 
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问题 

希望 在 本 地 文件 系统 中 使 用 临时 文件 。 
解决 方案 

使 用 Java 内 建 的 java.io.File 类 的 createTempFile 静态 方法 ， 在 JVM 的 默认 临时 目录 中 
创建 临时 文件 ， 参 数 是 文件 名 和 扩展 名 : 











(def my-temp-file (java.io.File/createTempFile "filename" ".txt")) 














然后 可 以 写 入 该 临时 文件 ， 就 像 用 任何 其 他 java.io.Fite 实例 一 样 : 





(with-open [file (clojure.java.io/writer my-temp-file)] 
(binding [*out* file] 
(println "Example output."))) 


讨论 
在 与 其 他 程序 交互 时 ， 如 有 果 它 们 使 用 基于 文件 的 API， 那 么 临时 文件 常常 很 有 用 。 使 用 
createTempFile 很 重要 ， 它 能 确保 临时 文件 放 在 文件 系统 的 合适 位 置 。 使 用 的 操作 系统 不 
同 ， 这 个 位 置 也 不 同 。 


要 取得 创建 的 临时 文件 的 完整 路 径 和 文件 名 ,就 调用 : 


























(.getAbsolutepath my-temp-file) 





可 以 用 File.deleteOnExit 方法 ， 指 明 在 JVM 退出 时 ， 自 动 删除 该 临时 文件 : 














(.deleteOnExit my-temp-file) 




















请 注意 ， 在 JVM 退出 前 ， 该 文件 不 会 被 删除 ， 而 且 如 果 进 程 崩 溃 或 非 正常 退出 ， 它 可 能 
也 不 会 被 删除 。 好 的 做 法 是 随时 删除 那些 不 再 需要 的 临时 文件 : 


(.delete my-temp-file) 


sh 


阅 


。 java.io.File 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/io/File.html) 。 


4.11 在 任意 位 置 读 写 文件 


作者 : John Jacobsen 





问题 
希望 在 文件 的 任意 位 置 读 写 ， 而 不 是 顺序 读 写 。 
解决 方案 


要 打开 一 个 (可 能 非常 大 的 ) 文件 进行 随机 访问 ， 请 用 Java 的 RandomAccessFile。seek 到 
你 期 望 的 位 置 ， 然 后 利用 各 种 write 方法 ， 在 这 个 位 置 写 人 数据 。 


例如 ， 要 生成 一 个 1 GB 的 文件 ， 除 末尾 的 整数 1234 之 外 ， 全 部 以 0 填充: 

















(import '[java.io RandomAccessFile]) 


(doto (RandomAccessFile. "/tmp/longfile" "rw") 
(.seek (* 1000 1000 1000)) 
(.writeInt 1234) 
(.close)) 








对 一 个 “标准 的 ”Java 文件 对 象 调用 Length 方法 ， 表 明文 件 的 大 小 是 正确 的 : 





(require '[clojure.java.io :refer [file]]) 
(.Length (file "/tmp/Llongfile")) 


;; -> 1000000004 





(也 可 以 直接 对 RandomAccessFile 调用 Length。) 


在 Clojure 中 ， 从 适当 的 位 置 读 取 值 和 写 和 是 非常 类 似 的 。 同 样 ， 对 RandomAccessFile 调 
用 seek， 然 后 使 用 合适 的 read 方法 : 








(Let [raf (RandomAccessFile. "/tmp/longfile" "r") 
_ (.seek raf (* 1000 1000 1000)) 
result (.readInt raf)] 
(.close raf) 
result) 


;; -> 1234 


讨论 
用 这 种 方式 写 文件 ， 默认 会 以 0 填充。 它 可 能 会 被 JVM 实现 和 底层 的 操作 系统 当成 是 
“ 稀 琉 文件 "， 从 而 获得 更 高 的 读 写 效率 。 














利用 Unix 的 od 程序 检查 我 们 刚 创建 的 文件 ， 通 过 命令 行进 行 16 进 制 导出 ， 可 以 看 到 该 
文件 由 6 组 成 ，1234 在 末尾 。 








$ od -Ad -tx4 /tmp/longfile 
0000000 00000000 00000000 00000000 00000000 
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* 


1000000000 d2040000 
1000000004 


在 字 节 偏 移 1000000000 处 ， 可 以 看 到 值 d2040006， 这 是 1234 的 16 进 制 ， 采 用 的 是 大 端 
(big-endian) 整数 表示 法 。(Java 整数 默认 是 大 端 表示 法 。 这 意味 着 最 高 位 的 字 节 存放 在 最 
低位 的 地 址 中 。) 








参阅 

。 4.14 节 “ 读 写 Clojure 数据 *”， 了 解读 取 整 个 文件 的 更 多 信息 。 

。 java.io.RandomAccessFile 的 API 文 档 (http://docs.oracle.com/javase/7/docs/api/java/io/ 
RandomAccessFile.html ) 。 

。 Unix 的 od 命令 (http://en.wikipedia.org/wiki/Od_(Unix))。 


4.12 ”并 行文 件 处 理 


作者 : Edmund Jackson 


问题 
希望 逐 行 转换 一 个 文本 文件 ， 但 想 用 到 所 有 的 CPU 内 核 ， 而 不 把 文件 载 和 到 内 存 。 


解决 方案 


解决 这 个 问题 的 捷径 就 是 对 Line-seq 返回 的 序列 应 用 pmap: 








(require ['clojure.java.io :as 'jio]) 


(defn pmap-file 
"Process input-file in parallel, applying processing-fn to each row 
outputting into output-file" 
[processing-fn input-file output-filel] 
(with-open [rdr (jio/reader input-file) 
wtr (jio/writer output-file)] 
(let [lines (line-seq rdr)] 
(dorun 
(map #(.write wtr %) 
(pmap processing-fn lines)))))) 


;; 调用 这 个 的 例子 


(def accumulator (atom 0)) 


(defn- example-row-fn 
"Trivial example" 
[row-string] 





(str row-string "," (swap! accumulator inc) "\n")) 
;; 调用 它 
(pmap-file example-row-fn "input.txt" "output.txt") 
讨论 
除了 map 或 dorun 这 样 的 基本 Clojure 结构 之 外 ， 这 个 例子 使 用 的 关键 函数 是 Line-seq 和 
pmap。 





line-seq 利用 java.io.BufferedReader 的 实例 (该 实例 由 clojure.java.io/reader 返 
回 ) ， 返 回 一 个 字符 串 的 惰性 序列 。 每 个 字符 串 是 输入 文件 中 的 一 行 。 分 行 时 以 什么 作为 
新 行 的 标识 ， 这 由 JVM 的 选项 Line.separator 来 决定 ， 它 将 根据 不 同 的 平台 来 设 定 。 具 
体 来 说 ， 在 Windows 上 是 回 车 加 换行 ， 在 Linux 或 Mac OS X 这 样 的 类 Unix 系统 上 ， 只 
是 一 个 换行 。 


pmap 与 map 功能 相同 ， 将 一 个 函数 作用 于 序列 中 的 每 个 元 素 ， 得 到 由 返回 值 构成 的 惰性 序 
列 。 不 同 之 处 在 于 ， 它 在 执行 映射 函数 时 ， 对 集合 中 的 每 个 元 素 启 用 一 个 独立 的 线程 (最 
多 到 一 定 的 数目 ， 这 与 系统 的 CPU 数 有 关 )。 如 果 值 还 没有 准备 好 ， 实 现 该 序列 的 线程 将 
阻塞 。 



























































通过 将 工作 分 派 到 多 个 CPU 内 核 上 并 行 执行 ，pmap 能 实现 可 观 的 性 能 改进 ， 但 它 并 非 神 
通 广大 。 有 具体 来 说 ， 它 为 了 实现 多 线程 的 调度 ， 导 致 了 一 定 的 协作 开销 。 通 常 ， 如 果 执 行 
的 是 重量 级 操作 ， 映 射 函数 是 计算 密集 型 的 ， 协 作 开 销 就 值得 ， 这 种 方法 就 能 提供 最 大 的 
好 处 。 而 对 于 能 够 快速 完成 的 简单 函数 (例如 对 原生 数据 的 基本 操作 )， 协 作 开 销 就 有 点 
得 不 偿 失 了 ， 在 这 种 情况 下 ，pmap 实际 上 可 能 比 map 慢 很 多 。 








设想 是 使 用 pmap 并 行 地 处 理 文件 行 序列 。 但 是 ， 接 着 就 需要 让 每 个 被 处 理 的 行 依次 通过 
(map #(.write wtr %) ...)， 以 确保 这 些 行 每 次 写 和 一行 (或 者 将 write 放 到 处 理 函 数 中 ， 
看 看 会 发 生 什 么 情况 )。 最 后 ， 因 为 是 惰性 序列 ， 所 以 需要 先 实现 它们 的 副作用 ， 然 后 再 
退出 with-open 语句 块 ， 否 则 在 你 希望 求 值 时 ， 文 件 已 经 关闭 了 。 这 是 通过 调用 dorun 实 
现 的 。 























这 里 有 一 些 和 警告。 首先， 尽管 输出 文件 中 行 的 次 序 与 输入 文件 相同 ， 但 处 理 的 次 序 是 不 保 
证 相同 的 。 其 次 ， 这 个 过 程 很 快 就 变 成 TO 密集 型 ， 因 为 所 有 的 写 入 都 在 一 个 线程 中 完成 ， 
所 以 除非 处 理 函 数 非常 耗 CPU， 否 则 速度 提升 可 能 不 及 预期 。 最 后 ，pmap 在 分 配 工 作 时 并 
非 完 美 ， 所 以 实际 速度 提升 程度 也 许 不 能 像 你 期 望 的 那样 对 应 系统 中 处 理 器 的 数目 。 

















pmap 方式 还 有 另 一 点 不 足 ， 实 际 文件 是 串 行 读 取 的 ， 利 用 了 一 个 java.io.Reader。 如 果 处 
理 任务 比 读 取 要 耗 时 得 多 ， 仍 然 可 以 获得 可 观 的 提速 ， 但 对 于 轻 量 级 任务 ， 瓶 颈 可 能 是 读 
取 文 件 本 身 ， 在 这 种 情况 下 ， 并 行 处 理 对 总 体 运行 时 间 就 没有 太 多 帮助 (其 至 可 能 更 糟 )。 
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。 4.13 节 “ 带 归 约 的 并 行文 件 处 理 ”， 探 讨 了 一 个 类 似 的 方法 ， 利 用 内 存 映 射 来 并 行 读 取 
文件 (也 用 了 Clojure 的 归 约 程序 取得 更 高 效率 ) 。 





4.13” 带 归 约 的 并 行文 件 处 理 


作者 : Edmund Jackson 


问题 
希望 对 文件 使 用 Clojure 的 归 约 程序 ， 实 现 并 行 处 理 ， 而 不 把 文件 载 入 到 内 存 。 


解决 方案 

使 用 Iota 库 (https://github.com/thebusby/iota)， 以 及 Clojure 归 约 库 的 filter、map 和 fold 
函数 ， 它 们 在 clojure.core.reducers 命名 空间 中 。 要 继续 这 个 实例 ， 请 在 项 目 依赖 关系 
中 加 入 [iota "1.1.1"]， 或 用 Lein-try 开始 REPL: 























$ lein try iota 


例如 ， 要 统计 一 个 很 大 的 文件 中 的 单词 个 数 : 





(require '[iota :as io] 
'[clojure.core.reducers :as r] 
'[clojure.string :as str]) 


;; 统计 单词 个 数 函 数 
(defn count-map 
"Returns a map of words to occurence count in the given string" 
[s] 
(reduce (fn [m w] (update-in m [w] (fnil (partial inc) 0))) 
{} 
(str/split s #" "))) 


(defn add-maps 
"Returns a map where each key is the sum of vals of that key in m1 and m2." 
([] 但) ;; 必要 的 基础 ， 用 于 折 又 时 的 结合 
([m1 m2] 
(reduce (fn [m [k v]] (update-in m [k] (fnil (partial + v) 0))) m1 m2))) 





;; 主 文件 处 理 

(defn keyword-count 
"Returns a map of the word counts" 
[filename] 
(->> (iota/seq filename) 








(r/filter identity) 
(r/map count-map) 
(r/fold add-maps))) 


讨论 

Iota 从 本 地 文件 系统 的 文件 中 创建 序列 。 不 像 file-seq 得 到 的 纯 顺序 式 惰性 序列 ，Iota 得 
到 的 序列 是 针对 Clojure 的 归 约 库 优化 的 ， 该 库 利 用 了 Java 的 Fork/Join 工作 窃取 (work- 
stealing) 框架 '， 以 提供 高 效 的 并 行 处 理 。 


keyword-count 函数 首先 创建 了 一 个 可 归 约 的 序列 ， 包 含 文 件 中 的 行 ， 并 过 滤 掉 空 行 (利用 
identity 函数 从 序列 中 消除 nil 值 )。 然 后 它 并 行 地 应 用 count-map 函数 ， 最 后 汇聚 结果 ， 
用 add-maps 函数 来 折叠 。 






































r/filter 和 r/map 函数 做 的 事情 与 不 针对 归 约 库 的 相应 函数 一 样 ， 区 别 在 于 性 能 以 及 归 
约 库 分 解 和 组 合 操 作 的 方式 。 它 们 也 返回 可 归 约 的 序列 ， 能 被 归 约 库 中 的 其 他 操作 有 效 
地 利用 。 


























r/fold 是 归 约 库 的 核心 函数 ， 其 基本 形式 在 功能 上 与 内 建 的 reduce 函数 非常 类 似 。 给 定 
一 个 函数 和 一 个 可 归 约 的 集合 ， 它 返回 一 个 值 ， 即 对 集合 中 的 每 个 元 素 应 用 折 琶 函数 并 累 
加 的 值 。 





但 是 ， 与 普通 的 reduce 不 同 ， 这 里 不 保证 执行 的 次 序 ， 这 也 是 为 什么 foLd 不 接受 一 个 初 
始 值 作为 参数 的 原因 。 那 样 做 没有 意义 ， 因 为 计算 可 以 同时 从 儿 个 地 方 “开始 "， 并 发 进 
行 。 这 意味 着 传递 给 fold 的 函数 (在 传递 一 个 函数 时 ) 必须 能 够 接受 9 个 参数 ， 因 为 对 
提供 的 函数 进行 无 参数 的 调用 ， 将 被 作为 每 个 计算 分 支 的 种 子 值 。 


如 果 需 要 更 多 灵活 性 ，fold 还 允许 同时 指定 reduce 函数 和 combine 函数 作为 独立 的 参数 。 具 
体 如 何 工作 与 归 约 国 数 的 工作 方式 密切 相关 ， 所 以 完整 的 解释 超出 了 本 实例 的 讨论 范围 。 更 
多 信息 ， 请 参见 fold 函数 的 API 文档 (http://clojure.github.io/clojure/clojure.core-api.html#clojure. 
core.reducers/fold) ， 以 及 Clojure 网 站 的 Reducer 页 下 






































(http://clojure.org/reducers ) 。 











关于 归 约 库 
归 约 库 是 一 个 并 行 计算 框架 ， 目 的 是 极为 高 效 地 并 行 处 理 。 完 整 解释 归 约 库 的 工作 原理 
超出 了 这 个 实例 的 讨论 范围 来龙去脉 请 参见 Clojure 网 站 上 关于 引入 归 约 库 的 博客 帖 
子 http://clojure.com/blog/2012/05/08/reducers-a-library-and-model-for-collection-processing. 
html)。 但 简单 来 说 ， 归 约 库 通过 以 下 两 种 方式 来 提升 性 能 。 















































注 1: 更 多 信息 ， 参 见 Java 指南 中 关于 Fork/Join 和 work stealing 的 部 分 (http://docs.oracle.com/javase/tutorial/ 


essential/concurrency/forkjoin.html) 。 
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。 它们 能 组 合 操作 。 在 逻辑 许可 时 ， 归 约 框架 将 能 组 合 的 操作 合并 成 一 个 操作 。 例 如 ， 前 
面 执行 filter 的 代码 和 接着 执行 map 的 代码 。Clojure 的 标准 filter 和 map 将 实现 一 个 
中 间 序 列 : filter 将 产生 一 个 序列 ， 然 后 交 给 map。 但 在 归 约 库 中 ,会 将 它们 组 合成 一 
个 map+filter 操作 (如 果 可 能 的 话 )， 一 次 执行 。 

。 它们 利用 了 被 归 约 数据 的 内 部 树 状 数据 结构 。 普 通 序列 生来 就 是 顺序 化 的 (这 不 奇怪 )， 
因为 它们 的 高 性 能 操作 就 是 每 次 从 头 上 取出 元 素 ， 所 以 很 难 有 效 地 在 各 个 元 素 间 分 配 工 
作 。 但 是 ， 归 约 库 注意 到 了 Clojure 持久 数据 结构 的 内 部 结构 ， 并 利用 它 来 有 效 地 分 配 
数据 处 理工 作 。 


在 底层 ，Iota 使 用 了 Java NIO 库 ， 为 处 理 的 文件 提供 内 存 映 射 视图 ， 实 现 高 效 的 随机 访 
问 。Iota 也 考虑 到 归 约 框架 ，Iota 的 序列 构造 方式 让 归 约 库 能 有 效 地 分 配 处 理工 作 。 



















































































参阅 
。 Tota 的 GitHub 代码 库 (https://github.com/thebusby/iota)。 
。 NIO 文档 (http://docs.oracle.com/javase/7/docs/api/java/nio/package-summary.html)。 


4.14 ” 读 写 Clojure 数 据 


作者 : John Cromartie 


问题 
需要 存 取 磁 盘 上 的 Clojure 数据 结构 。 


解决 方案 

用 pr-str 和 spit 来 序列 化 少量 数据 : 
(spit "data.clj" (pr-str [:a :b :c])) 

用 read-string 和 slurp 读 取 少 量 数据 : 


(read-string (slurp "data.clj")) 
;; -> [:a :b :c] 


用 pr 向 流 中 高 效 地 写 入 大 型 数据 结构 : 
(with-open [w (clojure.java.io/writer "data.clj")] 


(binding [*out* w] 
(pr large-data-structure))) 


用 read 从 流 中 高 效 地 读 取 大 型 数据 结构 : 





(with-open [r (java.io.PushbackReader. (clojure.java.io/reader "data.clj"))] 
(binding [*read-eval* faLse] 
(read r))) 


讨论 

在 Clojure 中 ， 代 码 就 是 数据 。 在 运行 时 ， 你 可 以 使 用 编程 语言 从 文件 加 载 代码 所 使 用 的 
读 取 程序 ， 这 使 得 这 个 任务 变 得 比较 简单 。 虽 然 这 通常 是 将 数据 持久 到 磁盘 上 的 好 方法 ， 
但 也 应 该 注意 一 些 问题 。 




















读 取 、 安全 和 edn 
read 函数 只 适合 从 信任 的 来 源 读 取 数 据 。 这 是 因为 Clojure 的 读 取 程 序 不 是 为 安全 而 
设计 的 ， 它 不 能 保证 安全 ， 也 不 能 避免 副作用 。 将 *read-eval* 绑 定 到 fatse 只 是 小 
小 的 安全 保护 措施 。 如 果 需 要 从 不 信任 的 来 源 读 取 Clojure 数据 结构 ( 即 不 是 你 自己 写 
下 的 数据 ) ， 就 要 看 cLojure.edn 库 。 
edn (可 扩展 数据 表示 法 ) 是 Clojure 的 数据 结构 序列 化 格式 的 一 种 规范 ， 有 多 种 实现 ， 
所 以 可 以 用 作 传 输 和 持久 格式 ， 并 被 所 有 程序 使 用 (无 论 程序 是 用 何 种 语言 写成 的 )， 
就 像 XML 或 JSON 一 样 。clojure.edn 库 是 edn 的 Clojure 实现 。 
它 的 工作 方式 很 像 Clojure 的 读 取 程序 和 写 入 程序 ， 但 它 提供 了 额外 的 安全 保证 ， 这 是 
Clojure 的 读 取 程序 做 不 到 的 。 对 于 外 部 或 不 信任 的 输入 ， 总 是 应 该 使 用 它 。 











如 果 数 据 量 非常 大 ， 简 单 情况 下 的 sturp 和 spit 就 不 可 用 了 ， 因 为 会 在 内 存 中 一 下 子 创建 
非常 大 的 字符 串 。 例 如 ， 序 列 化 100 万 随机 数 (由 rand 创建 )， 将 得 到 18 MB 的 文件 ， 在 
读 写 时 将 消耗 更 多 的 内 存 : 





(spit "data.clj" (pr-str (repeatedly 1e6 rand))) 
;; -> OutOfMemoryError Java heap space ... 


























但 是 ， 如 果 你 知道 只 要 处 理 少量 的 数据 ， 这 种 方法 就 非常 合适 。 对 于 加 载 配置 数据 或 其 他 
类 型 的 简单 结构 ， 它 是 一 种 好 方法 。 


用 流 读 写 更 为 高 效 ， 因 为 它 是 带 缓冲 的 输入 和 输出 ， 同 时 处 理 一 些 字 节 的 数据 *。 


除了 读 写 文件 中 的 单个 数据 结构 外 ， 还 可 以 将 更 多 的 数据 结构 添加 到 同一 个 文件 中 ， 以 后 
作为 序列 读 取 : 




















(spit "data.clj" (prn-str [1 2 3])) 
(spit "data.clj" (prn-str [:a :b :c]) :append true) 
;; data.clj now contains two serialized structures 








注 2: 关于 管理 流 的 注意 事 
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随 着 时 间 的 推移 在 文件 后 面 加 上 少量 数据 很 有 用 处 ， 例 如 作为 事件 或 事务 日 志 








但 是 ， 要 从 一 个 字符 串 中 读 取 多 个 对 象 ，read-string 是 不 够 的 。 要 从 流 中 读 取 一 





象 ， 必 须 连 续 调 用 read， 直 到 结束 。 





(defn- read-one 
[r] 
(try 
(read r) 
(catch java.lang.RuntimeException e 
(if (= "EOF while reading" (.getMessage e)) 
: :EOF 
(throw e))))) 


(defn read-seq-from-file 
"Reads a sequence of top-level objects in file at path." 
[path] 
(with-open [r (java.io.PushbackReader. (clojure.java.io/reader path))] 
(binding [*read-eval* falsel] 
(doall (take-while #(not= ::EOF %) (repeatedly #(read-one r))))))) 


参阅 

。 4.4 市 “访问 资源 文件 ”。 
。 4.15 证 “在 配置 文件 中 使 用 edn”。 

。 4.17 节 “ 读 取 Clojure 数据 时 处 理 未 知 的 带 标签 字面 值 ”。 


4.15 在 配置 文件 中 使 用 edn 


作者 : Luke VanderHart 




















问题 
希望 使 用 像 Clojure 那样 的 数据 字面 量 来 配置 应 用 。 


解决 方案 


用 保存 在 edn 文件 中 的 Clojure 数据 结构 来 定义 一 个 映射 表 ， 包 含 需要 的 配置 项 。 























系列 对 


例如 ， 一 个 应 用 需要 知道 它 自己 的 主机 名 和 关系 数据 库 的 连接 信息 ， 它 的 edn 配置 可 能 是 








这 样 


{:hostname "localhost" 
:database {:host "my.db.server" 
:port 5432 
:name "my-app" 





:USer "root" 
:password "sOQQp3rs3cr3t"}} 


利用 edn 读 取 程序 ， 将 这 段 数据 读 入 Clojure 映射 表 的 基本 函数 是 很 简单 的 : 
(require '[clojure.edn :as edn]) 
(defn Load-config 
"Given a filename, load & return a config file" 


[filename] 
(edn/read-string (slurp filename))) 





下 


调用 新 定义 的 Load-config 函数 会 得 到 一 个 配置 映射 表 ， 可 以 像 其 他 映射 表 一 样 ， 在 应 用 
中 传递 和 使 用 。 


讨论 
从 前 面 的 代码 中 可 以 看 到 ， 得 到 包含 配置 数据 的 映射 表 的 过 程 很 简单 。 更 有 趣 的 问题 是 ， 
得 到 配置 映射 表 后 如 何 使 用 。 一 般 来 说 有 两 种 思路 。 


第 一 种 思路 注重 开发 的 方便 ， 让 配置 映射 表 作为 背景 环境 ， 在 整个 应 用 中 随时 可 以 访问 。 
通常 会 设置 一 个 全 局 的 var， 包 含 该 配置 。 


























但 是 ， 由 于 某 些 原因 ， 这 样 做 容易 出 问题 。 首 先 ， 很 难 在 不 同 环境 下 履 写 默认 的 配置 文 
件 ， 例 如 测试 环境 ， 或 是 在 同一 个 JVM 中 运行 两 个 配置 不 同 的 系统 。( 可 以 利用 线程 局 部 
绑 定 来 绕 过 ， 但 这 将 很 快 导 致 代码 混乱 。) 


更 重要 的 是 ， 使 用 全 局 配置 意味 着 读 取 配 置 的 函数 (在 相当 大 的 应 用 中 ， 这 是 大 多 数 函 
数 ) 不 是 纯 的 。 在 Clojure 中 ， 这 意味 着 放弃 了 很 多 。 纯 Clojure 代码 的 主要 好 处 是 它 的 局 
部 透明 性 ， 函 数 的 行为 只 要 看 它 的 参数 和 代码 就 能 确定 。 但 是 ， 如 果 每 个 函数 都 读 取 全 局 


变量 ， 这 就 变 得 困难 得 多 。 
































另 一 种 思路 是 在 所 有 需要 的 地 方 ， 显 式 传递 配置 ， 就 像 所 有 其 他 参数 一 样 。 因 为 配置 文 
件 通常 是 在 应 用 启动 时 提供 的 ， 所 以 配置 常常 在 -main 函数 中 建立 ， 再 传递 到 所 有 需要 
的 地 方 。 


这 听 起 来 很 痛苦 ， 对 每 个 国 数 多 传 一 个 参数 确实 也 让 人 有 点 气 恼 。 但 这 样 做 让 代码 在 很 大 
程度 上 能 自我 解释 ， 应 用 的 哪些 部 分 依赖 于 配置 变 得 十 分 清楚 。 这 也 使 得 运行 时 修改 配置 
更 简单 ， 在 测试 场景 中 提供 不 同 的 配置 也 更 容易 。 

使 用 多 个 配置 文件 


在 配置 应 用 时 ， 一 种 常见 的 模式 就 是 有 几 类 不 同 的 配置 项 。 某 些 配置 字段 比较 稳定 ， 在 相 
的 环境 中 ， 不 会 在 不 同 的 应 用 实例 之 间 变 化 。 它 们 常常 和 应 用 源 代码 一 起 ， 提 交 到 源 代 
































可 
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码 版 本 控制 中 。 


另 一 
包括 数据 库 口 令 或 安全 API 的 令 牌 ， 











些 配 置 项 也 相当 稳定 ， 但 出 于 安全 考虑 ， 不 能 提供 到 源 代码 版 本 控制 中 。 这 样 的 例子 
它们 最 好 是 放 在 独立 的 配置 文件 中 。 还 有 一 些 配置 字 








段 (如 下 地 址 ) 通常 在 每 个 部 署 实例 中 都 完全 不 同 ， 最 好 是 狐 
字段 分 开 。 


处 理 这 种 不 同 有 一 个 技巧 ， 就 是 使 用 多 个 配置 文件 ， 
虑 ， 然 后 将 它们 合并 为 一 个 配置 映射 表 ， 传 递 给 应 用 。 通 常 
函数 : 




















(defn deep-merge 
"Deep merge two maps" 
[& values] 
(if (every? map? values) 
(apply merge-with deep-merge values) 
(last values))) 














会 合并 两 个 映射 表 ， 如 果 values 都 是 映射 表 ， 就 合并 它们 。 
ii 个 “胜出 ”， 出 现在 结果 映射 表 中 。 











然后 ， 重 写 配置 加 载 程 序 ， 接 受 多 个 配置 文件 ， 合 并 在 一 起 : 
(defn Load-config 
[& filenames] 
(reduce deep-merge (map (comp edn/read-string slurp) 
filenames))) 


R 立 指定 它们 ， 与 稳定 的 配置 


每 个 配置 文件 处 理 一 种 不 同类 型 的 性 


会 用 一 个 简单 的 deep-merge 

















如 果 values 不 全 是 映射 表 ， 


对 两 个 独立 的 edn 配置 文件 (config-public.edn 和 config-private.edn) 运用 这 种 方法 ， 得 到 


一 个 合 六 


F 的 映射 表 。 





config-public.edn: 


{:hostname "localhost" 
:database {:host "my.db.server" 
:port 5432 
:name "my-app" 
:user "root"}} 


config-private.edn: 


{:database {:password "s3cr3t"}} 


(load-config "config-public.edn" "config-private.edn") 
-> {:hostname "localhost", :database {:password 
:host "my.db.server", :port 5432, 


233 


339 





要 注意 ， 在 两 个 配置 文件 中 都 有 的 值 











:name "my-app", 


"s3cr3t", 


:User "root"}} 


将 取 load-config 的 最 右 参数 文件 中 的 值 。 





不 同 环境 下 的 不 同 配置 
如 果 系 统 运 行 在 多 种 环境 中 ， 你 可 能 希望 根据 当前 运行 的 环境 来 变动 配置 。 例 如 ， 在 开发 
环境 中 希望 连接 到 本 地 数据 库 ， 在 产品 环境 中 希望 连接 到 产品 数据 库 。 


可 以 利用 Leiningen 的 profiles 功能 来 实现 这 一 点 。 通 过 为 项 目 配置 中 的 每 个 文件 提供 不 同 
的 :resource-paths 选项 ， 可 以 变更 每 种 环境 下 读 入 的 配置 文件 ": 

















(defproject my-great-app "0.1.0-SNAPSHOT" 
os 
:profiles {:dev {:resource-paths ["resources/dev"]} 
:prod {:resource-paths ["resources/prod"]}}}) 





项 目 配 置 与 前 面 的 类 似 ,现在 你 可 以 创建 两 个 不 同 的 配置 具有 相同 的 文件 名 ， 即 


resources/dev/config.edn 和 resources/prod/config.edn: 











。 resource/dev/config.edn: 


{:database-host "localhost"} 


。 resources/prod/config.edn: 


{:database-host "production.example.com"} 
如 果 你 打算 继续 自己 操作 ， 请 将 load-config 函数 添加 到 项 目的 一 个 命名 空间 中 : 


(ns my-great-app.core 
(:require [clojure.edn :as edn])) 


(defn Load-config 
"Given a filename, load & return a config file" 
[filename] 
(edn/read-string (slurp filename))) 


现在 ， 应 用 加 载 的 配置 将 取决 于 项 目 运 行 时 采用 哪个 文件 : 


# "dev" 是 Leiningen 的 默认 文件 之 一 

$ lein repl 

User=> (require '[my-great-app.core :refer [load-config]]) 
user=> (load-config (clojure.java.io/resource "config.edn")) 
{:database-host "localhost"} 

User=> (exit) 


$ lein trampoline with-profile prod repl 

User=> (require '[my-great-app.core :refer [load-config]]) 
User=> (load-config (clojure.java.io/resource "config.edn")) 
{:database-host "production.example.com"} 








注 3: 要 继续 操作 ， 请 用 Lein new my-great-app 创建 你 自己 的 项 目 。 
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参阅 

。 4.4 三 “访问 资源 文件 ”。 

。 4.16 节 “ 将 记录 作为 edn 值 发 布 ”。 

。 4.17 节 “ 读 取 Clojure 数据 时 处 理 未 知 的 带 标签 字面 值 ”。 

。 Leiningen profiles 指南 (https://github.com/technomancy/leiningen/blob/master/doc/TUTORIAL. 
md#profiles) 6 


4.16 ”将 记录 作为 edn 值 发 布 


作者 : Steve Miner 











希望 将 Clojure 记录 当成 edn 值 使 用 ,但 edn 不 支持 记录 。 


解决 方案 
可 以 利用 tagged 库 ， 将 记录 作为 edn 带 标签 的 字面 值 来 读 入 或 输出 。 开 始 之 前 ， 请 在 项 目 
依赖 关系 中 加 入 [com.velisco/tagged "0.3.0"]， 或 用 Lein-try 开始 REPL: 




















$ lein try com.velisco/tagged 


要 扩展 Clojure 内 建 的 print-method 多 重 方法 ， 以 带 标签 的 形式 来 打印 记录 ， 就 要 利用 
miner .tagged/pr-tagged-record-on 辅助 函数 ， 扩 展 针 对 该 记录 的 print-method: 











(require '[miner.tagged :as tag]) 
(defrecord SimpleRecord [a]) 
(def forty-two (->SimpleRecord 42)) 


(pr-str forty-two) 
;; -> "#user.SimpleRecord{:a 42}”;; 不 幸 的 是 ， 不 是 正确 的 edn 值 


(defmethod print-method user.SimpleRecord [this w] 
(tag/pr-tagged-record-on this w)) 


(pr-str forty-two) 
;; -> "#user/SimpleRecord {:a 42}" 








现在 ， 就 可 以 利用 edn 带 标签 的 字面 值 格式 ， 在 pr-str 和 miner.tagged/read-string 之 间 
来 回转 换 记录 : 











(tag/read-string (pr-str forty-two)) 
;; -> #user/SimpleRecord {:a 42} 


(= forty-two 
(tag/read-string (pr-str forty-two))) 
;; -> true 





但 是 ，edn 读 取 程序 仍 不 知道 如 何 解 析 这 些 带 标签 的 值 。 为 了 支持 这 一 行为 ， 在 用 edn 读 
取 值 时 ， 用 miner .tagged/tagged-default-reader 作为 :default 选项 : 





(require '[clojure.edn :as edn]) 


(edn/read-string {:default tag/tagged-default-reader} 
(pr-str {:my-record forty-two})) 
;; -> {:my-record #user/SimpleRecord {:a 42}} 


讨论 

edn 格式 非常 好 ， 因 为 它 覆 盖 了 Clojure 数据 类 型 中 一 个 有 用 的 子 集 ， 让 高 保 真 的 数据 传 
偷 变 得 很 容易 。 不 幸 的 是 ， 它 不 支持 记录 。 但 这 很 容易 修正 ， 根 据 名 字 ，edn 是 一 种 可 
扩展 的 格式 。 我 们 只 需要 提供 标签 风格 的 打印 输出 (#tag <vatue>) 和 适当 的 读 取 程 序 。 
tagged 库 使 得 这 些 任务 非常 容易 。 


从 前 面 的 例子 可 以 看 出 ，Clojure 默认 的 记录 打印 值 比较 像 ， 但 并 不 是 edn 期 望 的 带 标签 的 
格式 。 




















虽然 Clojure 对 SimpleRecord 打印 出 "#user.SimpleRecord{:a 42}"， 但 是 edn 需要 的 是 
带 标 签 的 字符 串 ， 就 像 "#user/SimpleRecord {:a 42}"。 国 数 miner.tagged/pr-tagged- 
record-on 知道 如 何以 这 种 格式 输出 记录 (到 一 个 java.io.Writer)。 用 这 个 函数 来 扩展 
Clojure 的 print-method 多 重 方 法 ， 就 能 确保 Clojure 总 是 以 带 标签 的 格式 输出 记录 。 


| 








要 读 入 这 些 值 ， 就 需要 告诉 edn 读 取 程序 如 何 解 析 新 的 记录 标签 。 根 据 设计 ，tagged 库 提 
供 了 miner.tagged/tagged-default-reader 国 数 ， 可 以 用 来 扩展 edn， 读 取 你 的 记录 标签 。 
如 果 edn 读 取 程 序 不 能 解析 标签 ， 它 就 尝试 用 :default 选项 指定 的 函数 来 处 理 标签 。 通 过 
指定 tagged-default-reader 作为 它 的 :default 选项 ，edn 读 取 程序 就 能 够 正确 地 解析 带 
标签 的 记录 值 。 





参阅 
。 4.17 节 “ 读 取 Clojure 数据 时 处 理 未 知 的 带 标签 字面 值 ” ,了解 :default 选项 的 更 多 信息 。 
。 GitHub 上 的 edn 扩展 数据 注释 (https:Wgithub.com/edn-formatedn ) 。 
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4.17 读 取 Clojure 数 据 时 处 理 未 知 的 带 标 签字 面值 


作者 : Steve Miner 
问题 
希望 读 取 Clojure 数据 (采用 edn 格式 )， 其 中 可 全 


解决 方案 


使 用 clojure.edn/read 或 clojure.edn/read-string 的 :default 选项 ; 








包含 未 知 的 带 标 签字 面值 。 








GCC 











(require 'clojure.edn) 
(defrecord TaggedValue [tag value]) 


(defn read-preserving-unknown-tags [s] 
(clojure.edn/read-string {:default ->TaggedValue} s)) 


(read-preserving-unknown-tags "#my.example/unknown 42") 
;; -> #user.TaggedValue{:tag my.example/unknown, :value 42} 


讨论 

edn 格式 对 Clojure 数据 类 型 的 重要 子 集 定义 了 打印 表示 形式 ， 通 过 带 标签 的 字面 值 来 提供 
扩展 性 。 读 取 edn 数据 最 好 的 方法 就 是 clojure.edn/read 或 clojure.edn/read-string。 这 
些 图 数 分 别 从 流 或 字符 串 中 消费 edn 格式 的 数据 ， 返 回 处 理 过 的 Clojure 数据 。 




















两 个 函数 都 接受 一 个 opts 映射 表 ， 它 允许 你 控制 读 取 时 的 几 个 选项 。 对 于 已 经 知道 的 标 
签 ， 可 以 提供 一 个 :readers 映射 表 ， 定 义 定制 的 读 取 程序 。 可 以 用 这 个 映射 表 覆 写 内 建 类 
型 的 行为 ， 它 们 是 在 clojure.core/default-data-readers 中 定义 的 : 

;; 创建 定制 的 读 取 程 序 


(clojure.edn/read-string {:readers {'inc-this inc}} 
"#inc-this 1") 























;; 之 前 …… 
(clojure.edn/read-string "#inst \"2013-06-08T01:00:00Z\"") 
;; -> #inst "2013-06-08T01:00:00.000-00:00" 


(clojure.edn/read-string {:readers {'inst str}} 
"#inst \"2013-06-08T01:00:00Z\"") 
;; -> "2013-06-08T01:00:00Z" 

















个 解决 方案 中 探讨 了 :default 选项 ， 它 非常 适合 处 理 未 知 的 标签 。 不 论 遇 到 什么 未 知 的 
标签 或 值 ， 你 提供 的 函数 都 会 被 调用 ， 两 个 参数 分 别 是 标签 和 值 。 
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如 果 没 有 向 read 提供 :default 选项 ， 读 到 未 知 的 标签 就 会 抛 出 Runti meException: 





(clojure.edn/read-string "#blow-up boom") 
;; -> RuntimeException No reader function for tag blow-up ... 


对 于 大 多 数 应 用 ， 读 取 未 知 的 标签 是 一 个 错误 ， 所 以 抛 出 异常 是 适当 的 。 但 是 ， 有 了 时候 也 
许 只 是 进入 另 一 个 处 理 阶段 ， 可 能 需要 保留 “未 知 的 ”标签 。 


利用 defrecord 定义 的 工厂 国 数 ， 很 容易 捕捉 到 未 知 的 读 取 程 序 字面 量 。Taggedvatue 工厂 
的 参数 次 序 与 :default 数据 读 取 程 序 的 规格 说 明 是 匹配 的 ， 这 很 方便 。 


TaggedValue 记录 保留 了 基本 信息 ， 以 备 将 来 使 用 。 因 为 所 有 读 入 的 信息 都 被 保留 下 来 ， 
所 以 其 至 可 以 用 原来 带 标签 的 字面 量 的 格式 再 次 打印 该 值 。 





























(defmethod print-method TaggedValue [this ^java.io.Writer w] 
(.write w "#") 
(print-method (:tag this) w) 
(.write w " ") 
(print-method (:value this) w)) 





;; 现在 ，TaggedValue 将 输出 为 原来 带 标签 的 字面 量 
(read-preserving-unknown-tags "#my.example/unknown 42") 
;; -> #my.example/unknown 42 








clojure.core/read 


edn 读 取 程序 并 不 是 一 直 就 有 的 。 在 以 前 ， 如 果 想 读 取 Clojure 数据 ， 可 以 使 用 两 个 内 
建 的 读 取 函 数 clojure.core/read 或 cLojure.core/read-string。 这 两 个 函数 的 目的 是 
从 “信任 的 来 源 ” 读 取代 码 或 数据 。 


因为 这 些 函 数 能 执行 代码 ,所 以 永远 不 应 该 使 用 cLojure.core 的 读 取 程 序 从 不 信任 的 
来 源 读 取 数 据 。 这 意味 着 用 户 的 数据 、 远 程 服务 器 (即使 属于 你 ) ， 或 者 几乎 是 任何 有 
关系 的 地 方 都 不 行 (当然 ， 这 有 点 极端 ， 但 我 们 项 望 你 安全 ) 。 


如 果 环 境 “ 确 实 ” 是 安全 的 ， 或 者 绝对 需要 执行 一 些 代 码 ， 那 就 务必 使 用 ctojure. 
core 的 读 取 程序 。 但 是 ， 在 设置 选项 的 接口 方面 ， 这 些 读 取 程 序 确实 与 cLojure.edn 
的 读 取 程 序 不 同 。 不 是 传 入 opts， 而 是 要 改变 各 种 动态 绑 定 ， 才 能 调节 读 写 程序 的 行 
为 。 例 如 ，*default-data-reader-fn* 决定 了 核心 函数 如 何 处 理 未 知 的 标签 。 更 多 信 
息 请 参见 *data-readers* 和 *read-eval* (http://clojure.github.io/tools.reader/) 。 这 就 是 
说 ， 对 于 读 入 数据 ， 使 用 edn 函数 通常 更 好 。 





1 这 实际 上 是 一 个 特征 ， 因 为 它们 是 语言 用 来 执行 代码 的 函数 。 

2 Clojure 邮件 列表 中 的 主题 “ANN: NEVER use clojure.core/read or read-string for reading untrusted 
data” (https://groups.google.com/forum/#!topic/clojure/YBkUalaRaow) 讨论 了 关于 ctLojure.core 读 取 
程序 脆弱 性 的 更 多 信息 。 
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sh 


阅 
。 edn: GitHub 上 的 扩展 数据 注释 (https://github.com/edn-format/edn ) 。 
。 4.14 节 “ 读 写 Clojure 数据 *”， 以 及 4.16 节 “ 将 记录 作为 edn 值 发 布 ”。 


4.18 从 文件 中 读 取 属性 


作者 : Tobias Bayer 


问题 
需要 读 取 属 性 文件 ， 并 访问 其 中 的 键 值 对 。 


解决 方案 

最 直接 的 方法 就 是 利用 Java 的 互 操 作 性 ， 使 用 内 建 的 java.util.Properties 类 (http:// 
docs.oracle.conyjavase/7/docs/apiyjava/utiyProperties.html ) 。 java.util.Properties 实现 了 java. 
util.Map 接口 ，Clojure 可 以 像 其 他 映射 表 一 样 轻松 地 使 用 。 





























下 面 的 例子 是 要 读 入 的 属性 文件 fruitcolors.properties: 














banana=yeLLow 
grannysmith=green 





用 文件 中 的 内 容 填充 一 个 Properties 实例 是 很 容易 的 ， 只 要 用 它 的 load 方法 ， 并 传人 一 
个 java.to.Reader 实例 就 行 。 该 实例 是 通过 clojure.java.io 命名 空间 得 到 的 ; 





(require '[clojure.java.io :refer (reader)]) 
(def props (java.util.Properties.)) 


(.Load props (reader "fruitcolors.properties")) 
;; -> nil 
props 

;; -> {"banana 


yellow", "grannysmith" "green"} 


除了 通过 互 操 作 性 来 使 用 内 建 的 Properties API 之 外 ， 也 可 以 用 propertea 库 ， 用 更 简 
单 、 更 符合 Clojure 习惯 的 方式 来 访问 属性 文件 。 














在 项 目的 project.clj 文件 中 添加 依赖 关系 [propertea "1.2.3"]， 或 用 Lein-try 启动 REPL: 


$ lein try propertea 1.2.3 





然后 读 取 属性 文件 ， 访 问 它 的 键 值 对 : 








(require '[propertea.core :refer (read-properties)]) 
(def props (read-properties "fruitcolors.properties")) 


props 
;; -> {:grannysmith "green", :banana "yellow"} 
(props :banana) 
;; -> "yellow" 


讨论 
虽然 直接 使 用 java.util.Properties 更 容易 想到 ， 也 不 需要 额外 的 依赖 关系 ， 但 是 
propertea 确实 提供 了 一 些 便利 。 它 返回 一 个 确实 不 可 改变 的 Clojure 映射 表 ， 而 不 是 
java.uttL.Map。 虽 然 两 者 在 Clojure 中 都 很 好 用 ， 但 如 果 打 算 做 进一步 的 操作 或 更 新 ， 不 
可 改变 的 映射 表 可 能 更 合适 。 


更 重要 的 是 ，propertea 将 所 有 键 字 符 串 转换 成 了 关键 字 ， 在 Clojure 的 映射 表 中 ， 比 用 字 
符 串 作为 键 更 为 常见 。 

而 且 ，propertea 还 有 其 他 一 些 特征 ， 比 如 能 够 将 值 解析 为 数字 或 布尔 类 型 ， 并 提供 默 
认 值 。 


在 默认 情况 下 ，propertea 的 read-properties 国 数 将 所 有 属 | 
下 属性 文件 ， 包 含 值 为 整数 和 布尔 类 型 的 键 : 





























生 


i 
Fa 


直 都 作为 字符 串 。 请 考虑 以 























intkey=42 
booleankey=true 





通过 提供 包含 :parse-int 和 :parse-boolean 选项 的 列表 ， 可 以 强制 将 这 些 属性 解析 为 对 应 
的 类 型 ; 
(def props (read-properties "other .properties'" 


:parse-int [:intkey] 
:parse-boolean [:booleankey])) 


(props :intkey) 
;; -> 42 


(class (props :intkey)) 
;; -> java.lang.Integer 


(props :booleankey) 
;; -> true 


(class (props :booleankey)) 
;; -> java.lang.Boolean 














有 时 候 属 性 文件 可 能 不 包含 某 个 键 值 对 ， 但 你 希望 设置 合理 的 默认 值 : 
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(def props (read-properties "other .properties"” :default [ :otherkey "awesome"])) 


(props :otherkey) 
;; -> "awesome" 


也 可 以 要 求 必 须 具 有 某 些 属性 。 如 果 期 望 的 属性 不 在 属性 文件 中 ， 会 抛 出 异常 : 














(def props (read-properties "other.properties" :required [:otherkey])) 
;; -> java.lang.RuntimeException: (:otherkey) are required ... 


阅 
propertea GitHub 代码 库 (https://github.com/jaycfields/propertea)。 
Properties API 文档 (http://docs.oracle.com/javase/7/docs/api/java/util/Properties.html)。 


4.19 读 写 二 进 制 文件 


作者 : John Jacobsen 





四 四 Ny 


CE 
解决 方案 

用 Java 的 BufferedInputStream、Buffered0utputStream 和 ByteBuffer 类 ， 直 接 处 理 二 
制 数据 。 

















央 





讨论 
虽然 在 纯 Clojure 中 读 写 文本 文件 很 容易 (例如 用 sLurp 和 spit)， 但 写 入 二进制 数据 就 需 
要 通过 Java 互 操 作 。 














Clojure 的 output-stream 包装 了 Java 的 BufferedOutputStream 对 象 。Buffered0utputStream 
有 一 个 write 方法 ， 它 接受 Java 字 节 数组 。 下 面 的 代码 向 /tmp/zeros 文件 写 入 1000 个 0 
( 字 节 ) : 


(require '[clojure.java.io :refer [file output-stream input-stream]]) 


(with-open [out (output-stream (file "/tmp/zeros"))] 
(.write out (byte-array 1000))) 





要 读 取 这 些 字 节 ， 使 用 对 应 的 input-strean 函数 ， 它 包装 了 BufferedInputStream: 





(with-open [in (input-stream (file "/tmp/zeros"))] 
(let [buf (byte-array 1000) 
n (.read in buf)] 
(println "Read" n "bytes."))) 


;;=> Read 1000 bytes. 





写 入 0 和 读 取 固 定 长 度 的 块 显然 不 太 有 趣 。 我 们 希望 用 一 些 实际 的 内 容 来 准备 字 市 数组 。 
准备 字 市 数组 的 常见 方法 是 使 用 ByteBuffer， 用 来 自 不 同类 型 的 数据 填充 它 。 假 定 我 们 要 





























用 下 面 的 格式 写 入 “字符 串 ”。 


(1) 版 本 号 (byte， 例 子 中 是 66)。 
(2) 字符 串 的 长 度 (大 端 int)。 
(3) 字符 串 对 应 的 字 节 (这 里 是 “hello world”)。 


下 面 的 函数 利用 ByteBuffer 作为 中 介 ， 将 字 节 “包装 ”好 放 入 数组 中 : 





Ep 











(import '[java.nio ByteBuffer]) 


(defn prepare-string [strdatal] 
(let [strlen (count strdata) 
version 66 
buflen (+ 1 4 (count strdata)) 
bb (ByteBuffer/allocate buflen) 
buf (byte-array buflen)] 
(doto bb 
(.put (.byteValuyue version)) 
(.putInt (.intValue strlen)) 
(.put (.getBytes strdata)) 
(.flip) ;; 准备 好 bb 用 于 读 取 
(.get buf)) 
buf )) 


(prepare-string "hello world") 

;;=> #<byte[] [BQ5ccaboe8> 

(into [] (prepare-string "hello world")) 

;;=> [66 0 0 0 11 104 101 108 108 111 32 119 111 114 108 100] 


然后 用 这 种 格式 写 数据 就 简单 了 : 


(with-open [out (output-stream "/tmp/mystring")] 
(.write out (prepare-string "hello world"))) 

















要 取 回 数据 ，ByteBuffer 提供 了 一 种 方法 ， 从 字 节 流 (数组 ) 中 解 包 出 多 个 类 型 : 


(defn unpack-buf [n buf] 
(Let [bb (ByteBuffer/aLLocate n)] 
(.put bb buf 0 n) ;; 用 数组 内 容 填 充 ByteBuffer 
(.flip bb) ;; 淮 备 读 取 
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(Let [version (.get bb 0)] 


(.position bb 1) ;; 跳 过 版 本 字 节 


(Let [bufLen (.getInt bb) 
strbytes (byte-array buflen)] ;; 准备 缓冲 

















区 来 保存 字符 串 数据 …. 





(.get bb strbytes) ;; …… 读 取 数 据 。 


[version buflen (appLy str (map char strbytes 


(with-open [in (input-stream "/tmp/mystring")] 
(let [buf (byte-array 1024) 
n (.read in buf)] 
(unpack-buf n buf))) 


;=> [66 11 "hello world"] 


))])))) 


请 注意 ， 对 于 写 入 和 读 取 ， 对 ByteBuffer 的 flip 操作 都 将 位 置 重 置 到 缓冲 区 开始 的 地 方 ， 


准备 读 取 和 写 入 。 


参阅 





。 ByteBuffer 在 Java 的 NIO 库 中 扮演 了 重要 角色 ， 关 于 它 的 更 多 细节 ， 参 见 Java NIO 
文 档 (http://docs.oracle.com/javase/7/docs/api/java/nio/package-summary.html) ”或 Ron 
Hitchens 的 著作 Java NIO (http://shop.oreilly.com/product/9780596002886.do, O'Reilly ) 。 

。 Clojure 库 bytebuffer (https://github.com/geoffsalmon/bytebuffer) 提供 了 轻便 的 、 更 符 


合 习惯 的 ByteBuffer 操作 包装 。 
。 更 新 一 点 的 Buffy 库 (https://github.com/clojurewerkz/buffy) 
的 包装 。 


























提供 了 相关 的 Netty ByteBuffer 


。 最 后 ，Gloss 库 (https://github.com/ztellman/gloss) 提供 了 一 个 DSL， 来 读 取 和 写 入 二 进 





制 数 据 流 (不论 基于 文件 还 是 基于 网 络 )。 


4.20 ” 读 写 CSV 数 据 


作者 : Jason Whitlark 


问题 
需要 读 写 CSV 数据 。 


解决 方案 


使 用 clojure.data.csv/read-csv， 从 String 或 java.io.Reader 中 情 性 读 取 CSV 数据 : 


(clojure.data.csv/read-csv "this,is\na,test" ) 
Ss i (["this" "is"] ["a" "test"]) 





(with-open [in-file (clojure.java.io/reader "in-file.csv")] 
(doall 
(clojure.data.csv/read-csv in-file))) 
;; -> (["this" "is"] ["a" "test"]) 





使 用 clojure.data.csv/write-csv 向 java.io.Writer 写 入 CSYV 数据 : 


(with-open [out-file (clojure.java.io/writer "out.csv")] 
(clojure.data.csv/write-csv out-file [["this" "is"] ["a" "test"]])) 
;; -> nil 


讨论 
Clojure.data.csv 库 让 处 理 CSV 变 得 很 容易 。 要 记 住 read-csv 是 惰性 的 ， 如 果 要 迫使 它 
马上 读 取 数据 ， 就 需要 用 doall 包装 read-csv 调用 。 











在 读 取 时 ， 可 以 改变 分 隔 符 和 引号 定义 符 ， 默 认 的 分 别 是 \ 和 \"。 但 指定 分 隔 符 必 须 用 字 
符 ， 而 不 是 字符 串 : 





(csv/read-csv "this$-is $-\na$test" :separator \$ :quote \-) 

;; -> (["this" "is $"] ["a" "test"]) 
在 写 入 时 ， 就 像 read-csv， 你 可 以 配置 分 隔 符 、3 引 号 和 换行 (选择 :lf (默认 ) 还 
是 :cr+1lf)， 以 及 quote? 谓词 函数 ， 它 接受 一 个 集合 ， 返 回 true 或 false， 表 明 字 符 串 表 
示 是 否 需 要 加 3 引 1 号 : 








(with-open [out-file (clojure.java.io/writer "out.csv")] 
(clojure.data.csv/write-csv out-file [["this" "is"] ["a" "test"]] 
:separator \$ :quote \-)) 
;; -> niL 








要 将 CSV 输出 作为 字符 串 记录 下 来 ， 就 用 with-out-str， 并 写 入 *out*: 


(with-out-str (csv/write-csv *out* [["this" "is"] ["a" "test"]])) 
;; -> "this,is\na,test\n" 


阅 


clojure.data.csv 的 GitHub 代码 库 (https://github.com/clojure/data.csv)。 


4.21 读 写 压缩 文件 


作者 : John Cromartie 


. Ns 
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问题 

希望 读 取 或 写 入 gzip 压缩 的 文件 ( 即 .gz 文件 
NA 

解决 方案 

用 java.util.zip.GZIPInputStream (http://docs.oracle.com/javase/7/docs/api/java/util/zip/ 

GZIPInputStream.html) 包装 普通 输入 流 ， 得 到 解压 的 数据 : 








下 
Nt 
o 








(with-open [in (java.util.zip.GZIPINputStream. 
(clojure.java.io/input-stream 
"file.txt.gz"))] 
(slurp in)) 


用 java.util.zip.GZzIPOutputStream (http://docs.oracle.com/javase/7/docs/opi/java/util/zip/ 
GZIPOutputStream.html) 包装 普通 输出 流 ， 在 写 入 时 压缩 数据 : 





(with-open [w (-> "output.gz" 
clojure.java.io/output-stream 
java.util.zip.GZIPOUutputStream. 
clojure.java.io/writer)] 

(binding [*out* w] 
(println "This will be compressed on disk."))) 


讨论 
基于 DEFLATE 算法 的 gzip， 是 类 Unix 系统 中 的 常见 压缩 方式 ， 大 量 用 于 Web 的 压缩 。 
它 特 别 适 合 压缩 文本 ， 能 大 幅 压 缩 源 代码 或 Clojure 和 JSON 的 数据 。 


许多 Clojure 的 IO 函数 接受 所 有 类 型 的 Java 流 。GZIPInputsStreanm 只 是 包装 了 另 一 个 输入 
流 ， 并 尝试 对 原来 的 流 进行 解压 缩 。 输 出 的 行为 也 是 类 似 的 。 
通过 包装 一 个 普通 输入 流 ， 比 如 clojure.java.io/input-strean 的 返回 值 ， 你 可 以 将 它 传 


递 给 slurp 或 line-seq (或 其 他 接受 输入 流 作为 参数 的 函数 )， 方 便 地 读 取 所 有 人 解压 缩 的 
内 容 。 


也 可 以 利用 这 种 技巧 逐 行 读 取 大 型 的 压缩 文件 ， 或 者 读 取 pr 和 pr-str 输出 的 Clojure 格 
式 。 还 可 以 用 类 似 的 方式 解压 来 自任 何其 他 流 的 数据 ， 例 如 ， 基 于 网 络 套 接 字 或 字 市 数组 


将 输出 流 绑 定 到 *out*， 我 们 就 可 以 用 printtn、pr 等 函数 ， 一 次 向 流 中 输入 少量 的 数据 ， 
这 些 数据 在 流 关闭 时 ， 将 压缩 到 磁盘 上 。 


可 以 用 几乎 同样 的 方法 来 写 入 ZIP 压缩 格式 的 数据 ， 只 要 使 用 java.util.zip. 
ZipInputStream (http://docs.oracle.com/javase/7/docs/api/java/util/zip/ZipInputStream.htm!l) 
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和 java.util.zip.ZipOutputStream (http://docs.oracle.com/javase/7/docs/api/java/util/zip/ 
ZipOutputStream.html) 类 。 


参阅 

。 4.14 节 “ 读 写 Clojure 数据 *”， 探 讨 了 从 磁盘 文件 读 取 Clojure 数据 。 

。 GZIPInputStream 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/java/util/zip/GZIPIn 
putStream.htm]l)。 


4.22 ”处 理 XML 数 据 


作者 : Stefan Karlsson 


问题 
需要 读 写 XML 数据 。 


解决 方案 
将 文件 传递 给 clojure.xml/parse， 得 到 一 个 Clojure 映射 表 ， 表 示 了 XML 文件 的 结构 。 


例如 ， 要 读 取 下 面 的 文件 : 


<simple> 
<item id="1">First</item> 
<item id="2">Second</item> 
</simple> 


利用 clojure.xml/parse: 


(require '[clojure.xml :as xmL]) 

(clojure.xml/parse (clojure.java.io/file "simple.xml")) 

;; -> {:tag :simple, :attrs nil, :content [ 

Ss {:tag :item, :attrs {:id "1"}, :content ["First"]} 
{:tag :item, :attrs {:id "2"}, :content ["Second"]}]} 


如 果 希 望 以 市 点 序列 的 方式 来 读 取 XML 文件 ， 就 将 XML 的 映射 表 传 递 给 xml-seq 函数 ， 
该 函数 属于 ctlojure.core 命名 空间 : 





(xml/xml-seq (clojure.xml/parse (clojure.java.io/file "simple.xml"))) 


xmL-seq 返回 节点 的 树 状 序列 ， 即 由 每 个 节点 构成 的 序列 ， 从 根 开始 ， 然 后 对 文档 进行 深 
度 优先 遍历 。 


要 写 入 XML 文件， 就 将 XML 结构 映射 表 传递 给 clojure.xml/emit。emit 将 该 XML spit 
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到 当前 绑 定 的 输出 流 (*out*)， 所 以 要 写 入 文件， 要 么 将 *out* 绑 定 到 该 文件 的 输出 流 ， 
要 么 用 with-out-str 宏 将 输出 流 记 录 到 字符 串 中 ， 然 后 用 spit 写 入 文件 : 








(spit "test.xml" (with-out-str (clojure.xml/emit simple-xml-map))) 


讨论 
处 理 XML 数据 时 ， 可 以 像 处 理 其 他 映射 表 一 样 。 下 面 例子 中 的 函数 ， 对 给 定 的 td 和 文 
件 ， 将 解析 该 文件 ， 找 到 id 属性 与 参数 一 致 的 节点 : 




















(defn get-with-id [id xml-file] 
(for [node (xml-seq (clojure.xml/parse xml-file)) 
:when (= (get-in node [:attrs :id]) id)] 
(:content node))) 
(get-with-id "2" simple-xml) 
;; -> (["Second"]) 
要 修改 XML， 只 要 对 这 种 Clojure 数据 表示 形式 使 用 普通 的 映射 表 操作 函数 。 


如 果 要 处 理 大量 的 XML 结构 ， 你 可 以 考虑 使 用 zipper。zipper 是 一 种 纯 国 数 式 数据 结构 ， 
用 于 -方便 高 效 地 实现 树 状 结构 (如 XML) 的 导航 和 修改 。 








zipper 是 一 个 深奥 的 话题 ， 全 面 的 讨论 超出 了 本 实例 的 范围 。 但 请 看 一 下 clojure.data. 
zip 库 (http://clojure.github.io/data.zip/) 的 文档 ， 其 中 提供 了 解释 和 例子 ， 说 明 如 何 用 它们 
高 效 地 处 理 XML。 








阅 
4.9 市 “ 读 写 文本 文件 ”。 
。 clojure.zip 命名 空间 的 API 文档 (http://clojure.github.io/clojure/clojure.zip-api.html)。 








4.23” 读 写 JSON 数 据 


作者 : Stefan Karlsson 


问题 
需要 读 写 JSON 数据 。 


解决 方案 


用 clojure.data.json/read-str 函数 读 取 JSON 字符 串 ， 成 为 Clojure 数据 : 
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(require '[clojure.data.json :as json]) 
(json/read-str "[{\"name\":\"Stefan\",\"age\":32}]") 
;; -> [{"name" "Stefan", "age" 32}] 


要 将 数据 写 回 成 JSON， 请 使 用 clojure.data.json/write-str 函数 ， 以 原来 的 Clojure 数 
据 作 为 参数 : 





(json/write-str [{"name" "Stefan", "age" 32 
;; -> "[{\"name\":\"Stefan\",\"age\":32}]" 
2 十 ~ 八 
讨论 


除了 读 写 字符 捉 之 外 ，clojure.data.json 也 提供 了 read 和 write 国 数 ， 分 别 与 java. 
io.Reader 和 java.io.Nriter 对 象 合 作 。 除 了 reader/writer 参数 不 同 之 外 ， 这 两 个 函数 与 
使 用 字符 串 的 对 应 函数 具有 相同 的 参数 和 选项 : 


(with-open [writer (clojure.java.io/writer "foo.json")] 
(json/write [{:foo "bar"}] writer)) 


(with-open [reader (clojure.java.io/reader "foo.json")] 
(json/read reader)) 
;; -> [{"foo" "bar"}] 








由 于 JavaScript 的 类 型 比较 人 简单， 所 以 JSON 表示 法 的 保 真 度 比 Clojure 数据 低 很 多 。 因 此 
你 可 能 会 发 现 ， 需 要 调整 键 或 值 的 解释 方式 。 一 个 常见 的 例子 就 是 将 JSON 的 字符 串 键 转 
换 成 合适 的 Clojure 关键 字 。 通 过 :key-fn 选项 ， 可 以 对 每 个 处 理 的 键 应 用 一 个 函数 : 











;; 在 读 取 时 修改 键 


(json/read-str "{\"name\": \"Stefan\"}") 
;; -> {"name" "Stefan"} 


(json/read-str "{\"name\": \"Stefan\"}" :key-fn keyword) 
;; -> {:name "Stefan"} 


;; 在 写 入 时 修改 键 


(json/write-str {:name "Stefan"}) 
= 区 "{\"name\":\"Stefan\"}" 


(json/write-str {:name "Stefan"} :key-fn str) 

;; -> "{\":name\":\"Stefan\"}”; 注意 多 出 来 的 \: 
你 也 许 想 控制 值 的 解释 方式 。 请 用 :value-fn 选项 来 指定 值 读 写 的 方式 。 你 提供 的 函数 在 
调用 时 会 传 入 两 个 参数 ， 键 和 对 应 的 值 : 

;; 正确 地 读 取 UUID 值 


(defn str->uuid [key value] 
(if (= key :uuid) 
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(java.util.UUID/fromString value) 
value)) 


(clojure.data.json/read-str 
"{\"'name\": \"Stefan\", \"uuid\": \"51674ca0-eadc-4a5b-b9fb-67b0O5d5a71b7\"}" 
:key-fn keyword 
:value-fn str->uuid) 

;; -> {:name "Stefan", :uuid #uuid "51674ca0-eadc-4a5b-b9fb-67b05d5a71b7"} 


;; 类 似 地 ， 写 入 UUID 值 
(defn uuid->str [key vaLue] 
(if (= key :uuid) 
(str value) 
value)) 


(clojure.data.json/write-str 
{:name "Stefan", :uuid #uuid "51674ca0-eadc-4a5b-b9fb-67b05d5a71b7"} 
:value-fn uuid->str) 
;; -> "{\"name\":\"Stefan\",\"uuid\":\"51674ca0-eadc-4a5b-b9fb-67b05d5a71b7\"}" 





你 可 经 猜 到 ， 如 果 同 时 提供 :key-fn 和 :value-fn,， 值 函数 总 是 会 在 键 函 数 之 后 调用 。 
不 必 说 ，:key-fn 和 :value-fn 选项 也 适用 于 write 和 read 国 数 。 

参阅 

。 4.14 节 “ 读 写 Clojure 数据 "， 探 讨 了 读 写 edn (Clojure) 数据 。 

。 clojure.data.json 的 API 文档 (http://clojure.github.io/data.json/) 探讨 了 关于 读 写 的 更 


多 内 容 。 本 实例 未 讨论 的 选项 包括 read 的 :eof-error?、:eof-value 和 :btigdec， 以 及 


write 和 的 :escape-unicode 和 :escape-slash。 


4.24 生成 PDF 文件 


作者 : Dmitri Sotnikov 


问题 
希望 利用 一 些 数据 生成 PDF。 





例如 ， 有 一 系列 映射 表 ， 可 能 是 通过 clojure.java.jdbc 查询 得 到 的 ， 你 希望 生成 一 份 
PDF 报告 


解决 方案 


使 用 clj-pdf 库 来 生成 报告 。 








| 


F 始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [clj-pdf "1.11.6"]， 或 用 lein-try 开始 REPL: 





$ lein try clj-pdf 





为 了 说 明 ， 假设 我 们 希望 展现 一 个 向 


且 


， 其 中 包含 以 下 雇员 记录 : 





(def employees 

[{:country "Germany", 
:place "Nuremberg", 
:occupation "Engineer", 
:Name "Neil Chetty"} 

{:country "Germany", 

:place "ULlm", 
:occupation "Engineer", 
:Name "Vera Ellison"}]) 


利用 clj-pdf .core/template 宏 ， 创 建 一 个 模板 来 展现 每 条 记录 : 


(require '[clj-pdf.core :as pdf]) 


(def employee-template 
(pdf /template 
[:paragraph 
:heading (.toUpperCase Sname)] 
:chunk {:style :bold} "occupation: "] $occupation "\n" 
:chunk {:style :bold} "place: "] $place "\n" 
:chunk {:style :bold} "country: "] $country 
:Spacer]])) 


pe Tt et 


(employee-template employees) 
;; -> ([:paragraph [:heading "NEIL CHETTY"] 
[:chunk {:style :bold} "occupation: "] "Engineer" "\n 
i [:chunk {:style :bold} "place: "] "Nuremberg" "\n" 
[:chunk {:style :bold} "country: "] "Germany" [:spacer]] 
:paragraph [:heading "VERA ELLISON"] 
:chunk {:style :bold} "occupation: "] "Engineer" "\n 
:chunk {:style :bold} "place: "] "Ulm" "\n" 
:chunk {:styLe :bold} "country: "] "Germany" 
:Spacer]]) 


- 
= 





利用 上 面 的 模板 和 数据 ， 调 用 clj-pdf .core/pdf 来 生成 PDF: 
(pdf/pdf [{:title "Employee Table"} 


(employee-template empLoyees)] 
"employees.pdf") 


你 会 在 运行 项 目 /REPL 的 目录 下 ， 找 到 employees.pdf 文件 ， 如 图 4-1 所 示 。 
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四 日 日 WW) employees.pdf (1 page) 





(mia Qle) [ss jw me 





NEIL CHETTY 


occupation: Engineer 
place: Nuremberg 
country: Germany 


VERA ELLISON 


occupation: Engineer 
place: UIm 
country: Germany 











4-1: employees.pdf 


讨论 

clj-pdf 基于 iText 和 JFreeChart 库 。 模 板 语法 受到 了 流行 的 Hiccup HTML 模板 引擎 的 
启发 。 

在 模板 中 ，$ 用 来 表示 将 由 动态 内 容 替 换 的 位 置 。 如 果 用 一 个 映射 表 来 填充 模板 ， 每 个 替 
换 占 位 符 ($name) 都 会 用 映射 表 中 对 应 键 的 值 来 填充 〈:name 键 的 值 ) 。 


除了 替换 简单 的 值 ， 也 可 以 对 这 些 值 进 一 步 处 理 。empLoyee-templLate 的 :heading 部 分 就 
是 这 么 做 的 ， 它 调用 了 (.toupperCase S$name)。 在 clj-pdf 中 ， 文 档 表 示 为 一 个 向 量 ， 甚 
中 包含 元 数据 的 映射 表 ， 然 后 是 内 容 。 内 容 又 可 以 包含 字符 串 、 向 量 ， 或 向 量 的 集合 。 


一 个 非常 简单 的 PDF: 

















(pdf/pdf [{:title "Hello World"} "Hello, World."] "hello-world.pdf") 


在 背后 ,一 组 内 容 自 动 展开 : 
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;; 这 是 “一 组 * 段落 …… 
(pdf [{} [[:paragraph "foo"] [:paragraph "bar"]]] "document.pdf") 


;; 等 价 于 这 些 * 独立 * 段落 
(pdf [{} [:paragraph "foo"] [:paragraph "bar"]] "document.pdf") 








除了 普通 字符 串 ， 每 个 内 容 元 素 都 表示 为 一 个 向 量 。 向 量 中 的 第 一 个 元 素 是 关键 字 的 类 
型 ， 后 面 跟 的 都 是 内 容 。c1lj-pdf 的 一 些 类 型 包括 :paragraph、:phrase、:list 和 :table: 

















ve 


:heading "Lorem Ipsum"] 
:Line] 
:list "first item" 

"second item" 

"third item"] 
:paragraph "I'm a paragraph"] 
:phrase "some text here"] 
:table 

["foo" "bar" "baz"] 
["foo1" "bar1" "baz1"] 
["foo2" "bar2" "baz2"]] 


| mm Dd ee 


I et ey 














某 些 元 素 接受 可 选 的 风格 元 数据 。 可 以 用 一 个 映射 表 跟 在 类 型 参数 后 面 (作为 向 量 的 第 二 
个 元 素 )， 提 供 这 种 风格 信息 : 


[:paragraph {:styLe :bold} "this text is bold"] 


[:chunk {:style :bold 
:size 18 
:family :helvetica 
:color [0 234 123]} 
"some large green text"] 








一 个 元 素 的 内 容 也 可 以 包含 其 他 元 素 (就 像 HTML 文档 )， 应 用 于 父 元 素 的 风格 将 被 子 元 
素 继 承 : 





[:paragraph "some content"] 


[:paragraph {:styLe :bold} 
"Some bold text" 
[:phrase [:chunk "even more"] "bold text"]] 








就 像 层 全 样式 表 (CSS)， 子 元 素 可 以 扩展 或 履 写 父 元 素 的 风格 ， 指 定 自己 的 风格 : 








[:paragraph 

{:style :bold} 

"Bold words" 

[:phrase {:color [0 255 221]} "Bold AND teal!"]] 





图 像 可 以 用 :image 元 素 虞 入 在 文档 中 。 图 像 的 内 容 可 以 是 java.net.URL、java.awt. Inage、 
字 节 数组 、Base64 字符 串 ， 或 表示 URL 或 文件 的 字符 串 : 
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[:image "my-image.jpg"] 
[:image "http://clojure.org/space/showimage/clojure-icon.gif"] 


比 页 面 大 的 图 像 将 自动 缩小 ， 以 适合 页 面 。 

















参阅 
。 要 获取 使 用 clj-pdf 的 更 多 信息 ， 包 括 元 素 类 型 和 图 表 功 能 的 完整 清单 ， 参 见 clj-pdf 
的 GitHub 代码 库 (https://github.com/yogthos/clj-pdf)。 


4.25 生成 带 可 滚动 文本 的 GUI 窗 


作者 : John Jacobsen， 最 初 由 John Walker 提交 











问题 

希望 创建 并 显示 一 个 GUI 窗口 。 

解决 方案 

虽然 Java 的 Swing 库 是 创建 Java GUI 最 常见 的 方式 〈 至 少 是 在 桌面 应 用 中 ) ， 但 Seesaw 


库 才 是 用 Clojure 创建 GUI 的 最 佳 工具 ， 它 包装 了 Swing， 提 供 了 更 符合 习惯 的 函数 式 
接口 。 


要 继续 这 个 实例 ， 先 用 Lein-try 启动 REPL : 
































$ lein try seesaw 


Swing 实现 了 “可 编程 的 观感 ”: 各 种 窗口 小 部 件 的 外 观 和 行为 都 可 以 修改 ， 但 常见 的 做 
法 是 设置 与 所 处 的 平台 匹配 ， 以 便 获 得 最 好 的 易 用 性 。 在 Seesaw 中 ， 设 置 本 地 观感 是 通 
过 native! 函数 来 实现 的 : 








(require '[seesaw.core :refer [native! frame show! config! 
pack! text scrollable]]) 


(native!) 
;; -> Nil 





要 创建 窗口 对 象 ， 就 用 frame 〈 它 在 背后 生成 了 Swing 对 象 JFrame) : 


(frame :title "Lyrical Clojure" :content "Hello World") 

;; -> #<JFrame$Tag$a79ba523 seesaw.core.proxy$javax.swing.JFrame$Tag$a79ba523 
a [frame0,0,22,0x0,invalid,hidden,layout=java.awt.BorderLayout, 

2 title=Lyrical Clojure,resizable,normal, 

pe defaultCloseOperation=HIDE_ON_CLOSE, 





3 rootPpane=javax. swing.JRootPane[ ,0,0,0x0,invalid, 


人 layout=javax. swing.JRootPane$RootLayout, 
2 alignmentX=0.0,alignmentY=0.0,border=,flags=16777673,maximumSize=, 
> minimumSize=,preferredSize=],rootPaneCheckingEnabled=true]> 





虽然 创建 了 窗 体 ， 但 什么 也 没有 显示 。 要 显示 窗 体 (如 图 4-2)， 就 用 show!: 


(def f (frame :title "Lyrical Clojure")) 





(show! f) 
;; -> #<JFrame$Tag$a79ba523 [...]> 





四 Oe Cooki... 


Es 











图 4-2: 简单 窗口 


讨论 


创建 了 窗口 后 ， 可 以 设置 它 的 大 小 ， 添 加 内 容 和 滚动 条 ， 详 情 见 下 文 。 





添加 内 容 


可 以 用 config! 来 改变 窗口 的 属性 : 





(config! f :content "Actual content!") 
;; -> #<JFrame$Tag$a79ba523 [...]> 


结果 如 图 4-3 所 示 。 





@ A eA Cooki... 


Actual content! 











图 4-3: 包含 基本 内 容 的 窗口 


改变 窗口 大 小 
可 以 在 创建 时 指定 窗口 的 大 小 : 


(def f (frame :title "Lyrical CLojure” :width 300 :height 150)) 
;; -> #<JFrame$Tag$a79ba523 [...]> 


但 是 ， 禁 代 做 法 通常 是 对 得 到 的 窗 体 对 象 调用 pack! ， 根 据 其 内 容 来 指定 宽度 和 高 度 属 


(-> f pack! show!) 
;; -> #<JFrame$Tag$a79ba523 [...]> 





0 


性 : 
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添加 可 滚动 内 容 
现在 向 窗口 添加 一 些 文本 ， 摘 录 莎 士 比 亚 的 十 四 行 诗 ; 


(def sonnet-text (->> "http://www.gutenberg.org/cache/epub/1041/pg1041.txt" 
slurp 
(drop 20000) 
(take 4000) 
(apply str))) 





| 





内 容 太 长 ， 当 前 窗口 无 法 容纳 (参见 





4-4)。 





(config! f :content sonnet-text) 
;; -> #<JFrame$Tag$a79ba523 [...]> 





四 OO 日 Lyrica... 
No longer yours,... 
图 4-4: 包含 的 文字 超出 空间 的 窗口 


一 般 会 再 次 调用 pack!， 调 整 窗 口 大 小 ， 适 应 新 的 内 容 。 但 在 大 多 数 屏幕 上 ， 都 不 能 放下 
全 部 的 内 容 ， 所 以 明确 地 设置 窗口 大 小 ， 并 添加 滚动 条 ， 如 图 4-5 所 示 。 























(.setSize f 400 400) 

(config! f :content (scrollable (text :multi-line? true 
:text sonnet-text 
:editable? false))) 





@O Lyrical Clojure 


No longer yours, than you your self here live: 
Against this coming end you should prepare, 
And your sweet semblance to some other give: 
So should that beauty which you hold in lease 
Find no determination; then you were 
Yourself again, after yourself's decease, 
When your sweet issue your sweet form should bear. 
Who lets so fair a house fall to decay, 
Which husbandry in honour might uphold, 
Against the stormy gusts of winters day 
And barren rage of death's eternal cold? 
Ol! none but unthrifts. Dear my love, you know， 
You had a father let your son say so. 


XIV 


Not from the stars do | my judgement pluck; 
And yet methinks | have astronomy， 

But not to tell of good or evil Iuck， 

Of plagues, of dearths, or seasons' quality; 
Nor can | fortune to brief minutes tell, 
Pointing to each his thunder, rain and wind, 
Or say with princes if it shall go well 














图 4-5， 带 滚动 条 的 较 大 窗口 
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text 图 数 的 :mutLti-Line? 选项 将 选择 JTextArea 作为 底层 对 象 ， 而 不 是 JTextField 
(JTextArea 用 于 多 行文 本 ，JTextField 用 于 单行 文本 )。:editable? 指明 你 不 希望 允许 用 
户 编辑 这 段 文 本 (也许 是 因为 他 们 不 太 可 能 改进 莎士比亚 的 原作 )。 像 其 他 创建 窗口 小 部 
件 的 Seesaw 函数 一 样 ，text 还 有 一 些 选项 ， 最 好 通过 API 文档 (http://daveray.github.io/ 
seesaw/) 来 学 习 。 











在 Clojure 中 ，Seesaw 的 函数 返回 Java 对 象 ， 总 是 可 以 直接 用 Java 方法 来 操作 它们 。 例 
如 ， 我 们 用 到 了 frame 返回 的 JFrame 对 象 的 .setSize 方法 。 这 种 互 操作 性 提供 了 强大 的 
能 力 ， 但 代价 是 程序 员 的 负担 变 重 了 ， 他 们 不 仅 要 使 用 Seesaw API， 而 且 常 常 要 用 到 底层 
Swing API 的 某 些 功能 。 


Seesaw 支持 各 种 GUI 任务 ， 包 括 创建 菜单 、 显 示 文 本 和 图 像 、 滚 动 条 、 单 选 框 、 复 选 框 、 
多 区 域 窗口 、 拖 放 等 等 。 除 了 已 经 有 的 几 十 本 Swing 的 书 ， 你 可 以 很 容易 写 一 整 本 书 来 讨 
论 Seesaw。 这 个 实例 只 是 一 个 起 点 ， 将 来 可 以 进一步 研究 Seesaw 库 。 














参阅 

。 Seesaw GitHub 代码 库 (https://github.com/daveray/seesaw ) 。 

。 Marc Loy 等 人 所 著 Java Swing, 2nd ed。(O’Reilly, http://shop.oreilly.com/product/978059 
6004088.do) 。 
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第 5 章 





5.0 简介 


网 络 |/0 和 Web 服 务 


我 们 建造 的 每 个 系统 都 必须 与 其 他 系统 通信 的 趋势 越 来 越 明显 。 如 果 不 通过 某 种 网 络 与 其 
他 计算 机 通信 ， 我 们 几乎 做 不 了 任何 事情 。 


本 章 探 讨 了 你 能 想到 的 所 有 标准 的 远程 通信 模式 (HTTP、TCP、UDP 等 )， 也 探讨 了 一 些 
新 兴 技 术 “， 如 面向 消息 的 架构 等 。 


5.1 发 出 HTTP 请 求 














作者 : John Cromartie 


问题 








解决 方案 


希望 发 出 简单 的 HTTP GET 或 POST 请 求 。 


用 sturp 发 出 简单 的 HTTP GET 请 求 : 














注 1: 实际 上 ,“ 设 办 法 区 























如: 你 正在 建造 分 布 式 系 统 ” 


(http://queue.acm.org/detail.cftm?id=2482856)。 


注 2: 正如 澳大利亚 歌曲 作者 Peter Allen 精辟 的 说 法 :“Everything old is new again”( 所 有 老 的 东西 又 新 了 ) 。 
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(slurp "http://example.com") 
;; -> "<!doctype html>\n<html>\n<head>\n <title>Example Domain</title> ... 














用 clj-http 库 来 发 出 GET、POST 和 其 他 请 求 ， 带 上 特定 的 参数 或 请 求 头 ， 处 理 重 定向 或 
其 他 特殊 情况 ， 或 取得 响应 的 具体 细节 。 





要 继续 本 实例 ， 请 在 项 目 依赖 关系 中 加 入 [clj-http "0.7.7"]， 或 用 Lein-try 开始 REPL: 


$ lein try clj-http 





用 clj-http.client/get 发 出 GET 请 求 : 


(require '[clj-http.client :as http]) 


(:status (http/get "http://clojure.org")) 
;; -> 200 


(-> (http/get "http://clojure.org") 
:headers 
(get "server")) 

;; -> "nginx" 


(-> (http/get "http://www.amazon.com/") 
:cookies 
keys) 


i 


session-id" "session-id-time" "x-wl-uid" "skin") 


GET 和 POST 请 求 都 可 以 带 参数 。 用 clj-http.client/post 发 出 POST 请 求 : 








(http/get "http://google.com/" {:query-params {:q "clojure"}}) 


;; -> {: 


status 200 ...} 


(http/post "http://example.com" {:form-params {:username "joecoder" 


;; -> {: 


甚至 可 以 用 : 





讨论 
sLurp 能 发 出 


:password "ilQv3clojure"}}) 
status 200 ...} 


multipart 选项 来 上 传 文件 ， 就 像 通 过 Web 浏 览 器 的 HTML 表格 一 样 。 


HTTP GET 请 求 ， 这 是 因为 它 的 参数 被 传递 给 clojure.java.io/reader， 后 


者 能 正确 处 理 并 打开 URL 字符 串 。 如 果 要 向 行为 良好 的 URL 发 起 快速 的 HTTP GET， 这 
就 足够 了 。 不 幸 的 是 ，stLurp 的 用 处 仅 此 而 已 。 除 了 其 他 限制 之 外 ， 它 对 于 HTTP 重 定向 


也 不 能 正确 处 理 。 





cLj-http 是 了 








E 常 灵活 的 Clojure 库 ， 它 包装 了 非常 强大 的 Apache HttpComponents 库 





(https:/hc.apache.org/) 。 它 的 功能 包括 针对 其 他 HITP 动词 的 方便 的 函数 ， 如 PUT 和 
DELETE， 收 发 cookie、 请 求 / 响应 头 和 其 他 请 求 元 数据 ， 利 用 流 、 文 件 或 字 节 数组 来 读 
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写 数据 ， 等 等 。 请 参考 GitHub 代码 库 (https://github.com/dakrone/clj-http)， 了 解 更 多 不 同 
的 选项 ， 以 及 更 多 的 例子 。 





如 果 你 构造 的 产品 系统 依赖 于 外 部 的 服务 ， 可 能 要 考虑 用 Netflix 的 Hystrix 库 (https:// 
github.com/Netflix/Hystrix) 来 包装 HTTP 调用 ， 让 应 用 的 容错 性 更 好 ， 更 有 弹性 。Hystrix 
提供 了 Clojure 绑 定 (https://github.com/Netflix/Hystrix/tree/master/hystrix-contrib/hystrix-clj)， 
可 以 用 来 包装 网 络 调用 ， 更 容易 地 管理 涉及 外 部 服务 的 复杂 失效 场景 。 





参阅 

。 clj-http 的 GitHub 代码 库 (https://github.com/dakrone/clj-http)。 

。 关于 异步 HTTP 调用 的 信息 ， 请 参见 5.2 市 “执行 异步 HTTP 请 求 ”。 

。 如 果 构 建 涉 及 外 部 服务 的 产品 系统 ， 请 考虑 Hystrix (https://github.com/Netflix/Hystrix) 
及 其 Clojure 绑 定 (https://github.com/Netflix/Hystrix/tree/master/hystrix-contrib/hystrix-clj) ， 
以 便 处 理 复杂 的 失效 场景 。 























5.2 ”执行 异步 HTTP 请 ; 
作者 : Alan Busby 和 Ryan Neufeld 

问题 

希望 执行 异步 HTTP 请 求 。 

解决 方案 


使 用 HTTP Kit (http://www.http-kit.org/) ， 它 是 高 性 能 的 、 事 件 驱 动 的 HTTP 客户 端 / 服 务 
器 库 。 


在 开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [http-kit "2.1.12"]， 或 用 lein-try 开始 REPL: 











$ lein try http-kit 


用 org.httpkit.client 的 任何 一 个 HTTP 动词 函数 ， 来 执行 异步 HTTP 请 求 。 在 这 些 函 数 
的 基本 形式 中 ， 它 们 会 返回 一 个 promise 对 象 ， 你 可 以 用 deref 来 等 待 ， 或 用 @ 便捷 读 取 : 





(require '[org.httpkit.client :as http]) 
(def response (http/get "http://example.com")) 
六 一 段 时 间 语 3 


(:status @response) 
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;; -> 200 


;; 或 者 ， 用 deref 来 指定 超时 毫秒 数 和 一 个 值 
(deref response 2000 nil) 
;; -> {:opts {:url "http://example.com", :method :get} 


He :body "..." 
人 :headers {:content-type "text/html", :content-length "1270" ...} 
i :status 200} 


讨论 

执行 HTTP 请 求 时 ， 多 半 时 间 花 在 建立 连接 和 等 待 服务 器 响应 上 。 异 步 请 求 让 应 用 在 等 待 
数据 传输 时 ， 能 继续 工作 。 
在 这 方面 ，HTTP Kit 提供 了 高 度 并 发 的 Web 服务 器 和 强大 的 HTTP 客户 端 。 对 于 异步 


请 求 ， 它 提供 了 回调 和 promise， 也 提供 了 长 连接 和 备用 的 SSL 引擎， 处 理 未 签名 的 
SSL 证 书 。 





























org.httpkit.client 命名 空间 定义 了 许多 HITP 方法 的 异步 版 本 ， 包 括 get、delete、 
head、post、put、options 和 patch。 每 个 动词 都 源 自 于 org.httpkit.client/request， 它 
定 了 一 个 公共 的 接口 。 指 定 方法 的 异步 请 求 发 出 ， 返 回 一 个 promise 对 象 。 当 请 求 完成 时 ， 
这 个 promise 将 被 结果 或 响应 填充 。 























所 有 request 函数 都 接受 一 个 可 选 的 选项 映射 表 ， 其 中 可 以 指定 一 些 键 ， 如 :query- 
params、:post-params 或 :headers。 这 些 阔 数 也 允许 指定 回调 函数 ， 在 请 求 完成 时 调用 : 





(http/get "http://example.com" 
{:timeout 1000 ;; ms 
:query-params {:search "value"}} 
(fn [{:keys [status headers body error]}] 
(if error 
(binding [*out* x*err*] 
(println "Failed with, " error)) 
(println body)))) 
; -> #<core$promises$reify_ _6310@582e6c93: :pending> 
; *Oout* 
<html> 
<head> 
<title>Example Domain</title> 


we 


ve 


阅 

。 关于 发 出 普通 的 、 非 异步 的 HTTP 请 求 ， 请 参见 5.1 节 。 

。 HTTP Kit 在 很 大 程度 上 受到 了 clj-http API (https://github.com/dakrone/clj-http) 的 启发 ， 
关于 这 个 库 的 更 多 信息 ， 参 见 5.1 市 。 
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5.3 发 出 Ping 请 求 


作者 : Jason Webb 


问题 
希望 ping 一 个 耳 地址 ， 检 查 它 是 否 可 访问 。 


解决 方案 


使 用 java.net.InetAddress 类 ， 检 查 该 地 址 是 否 isReachable: 





(.isReachable (java.net.InetAddress/getByName "oreilly.com") 5000) 
;; -> true 


讨论 
如 果 能 得 到 正确 的 授权 ， 使 用 isReachable 的 效果 就 很 好 。 在 典型 的 类 Unix 实现 中 ， 需 
要 用 sudo 来 启动 Clojure 实例 ， 才 能 发 出 实际 的 ICMP ping 包 。 否 则 ， 标 准 连 接 会 尝试 


端口 7， 这 常常 会 被 防火 墙 封 掉 。Javadoc (http://docs.oracle.com/javase/7/docs/api/java/net/ 
InetAddress.html#isReachable(int)) 中 有 更 多 相关 信息 。 




















在 ping 另 一 台 机 器 时 ， 常 常 需要 计时 。 可 以 用 一 个 国 数 timed-ping 来 包装 .isReachable 
调用 ， 返 回 每 次 ping 的 时 间 : 





(defn timed-ping 
"Time an .isReachable ping to a given domain" 
[domain timeout] 
(Let [addr (java.net.InetAddress/getByName domain) 
start (. System (nanoTime)) 
result (.isReachable addr timeout) 
total (/ (double (- (. System (nanoTime)) start)) 1000000.0)] 
{:time total 
:result result})) 


(timed-ping "oreilly.com" 5000) 
;; -> {:time 88.07, :result true} 


sh 


阅 
。 InetAddress/isReachable 的 文档 (http://docs.oracle.com/javase/7/docs/api/java/net/InetAddress. 
html#isReachable(int) ) 。 





5.4 取得 并 解析 RSS 数 据 


作者 : Osbert Feng 


问题 
需要 解析 RSS 数据 。 
解决 方案 


利用 feedparser-clj 库 来 解析 RSS 数据 。 





有 有 


E 


F 始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [org.clojars.scsibug/feedparser-clj "0.4.0"]， 











或 用 Lein-try 开始 REPL: 


$ lein try org.clojars.scsibug/feedparser-clj 


以 RSS Feed 的 URL 为 参数 来 调用 feedparser-clj.core/parse-feed， 取 得 相应 的 数据 ， 
并 解析 成 Clojure 数据 : 


(require '[feedparser-clj.core :as rss]) 


(rss/parse-feed (str "https://github.com/clojure-cookbook/clojure-cookbook/" 
"commits/master .atom")) 

;; -> {:authors [...] 

3 :entries [{:Link "LINK" :title "TITLE" :contents "CONTENT"} ...] 

总 a 





也 可 以 用 java.io.InputStrean 为 参数 调用 parse-feed， 从 文件 或 其 他 位 置 读 取 数据 : 





(with-open [writer (clojure.java.io/writer "master.atom")] 
(spit writer 
(slurp (str "https://github.com/clojure-cookbook/clojure-cookbook/" 
"commits/master .atom")))) 


(with-open [stream (clojure.java.io/input-stream "master.atom")] 
(rss/parse-feed stream)) 

;; -> {:authors [...] 

:entries [{:link "LINK" :title "TITLE" :contents "CONTENT"} ...] 

Fe i 


讨论 
feedparser-clj 包装 了 Java ROME 库 ， 它 能 够 处 理 各 种 格式 的 RSS 和 Atom feed。 
feedparser-clj.core/parse-feed 返回 一 个 Clojure 映射 表 ， 非 常 像 背 后 的 XML feed。 
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大 多 数 时 候 ， 你 关心 的 数据 在 :entries 键 中 ， 它 包含 了 一 组 映射 表 ， 对 应 于 每 个 RSS 条 目 。 


有 些 RSS feed 有 <link rel="next"> 元素， 表明 返回 的 列表 不 完整 ， 依 照 该 链接 能 取得 更 
多 条 目 。 可 以 生成 这 些 RSS 条 目的 情 性 列表 : 


(defn next-uri 
"Return the rel=next href in a feed." 
[feed] 
(-> feed 
:entry-links 
(->> (filter #(= (:rel %) "next"))) 
first 
:href)) 


(defn lazy-stream 
"Return a lazy stream of RSS entries." 
[uri] 
(Let [raw-response (rss/parse-feed uri)] 
(Lazy-cat (:entries raw-response) 
(if-let [nxt (next-uri raw-response)] 
(Lazy-stream nxt))))) 


要 验证 惰性 加 载 正在 发 生 ， 可 以 在 lazy-stream 中 加 上 日 志 或 追踪 信息 ， 但 也 很 容易 确认 
取得 的 条 目 比 一 次 性 取得 的 条 目 多 : 





(def youtube-feed "http://gdata.youtube.com/feeds/api/videos") 


(count (rss/parse-feed youtube-feed)) 
;; -> 15 


(count (take 50 (Lazy-stream youtube-feed))) 
;; -> 50 





在 REPL 中 对 惰性 序列 求 值 要 谨慎 ， 因 为 它 会 尝试 打印 整个 序列 。 使 用 take 
以 便 只 实现 序列 的 一 部 分 。 








参阅 
。 4.22 节 “ 处 理 XML 数据 ”， 探 讨 了 读 写 RSS feed 这 样 的 XML 数据 的 更 多 内 容 。 
。 5.1 节 “ 发 出 HTTP 请 求 ”。 


5.5 发 送 邮件 


作者 : Ryan Neufeld 
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问题 
需要 在 Clojure 应 用 中 发 送 邮 件 。 
解决 方案 


使 用 postal 来 发 送 邮 件 ， 它 是 JavaMail 包 的 简单 包装 。 








要 继续 这 个 实例 ， 请 用 lein-try 启动 REPL: 


$ lein try com.draines/postal 


调用 postal.core/send-message 函数 来 发 送 消息 ， 参 数 是 两 个 映射 表 ， 第 一 个 包含 连接 的 
细节 ， 第 二 个 包含 消息 的 细节 。 例 如 ， 通 过 Gmail 账号 发 送 一 封 邮件 给 你 自己 : 


如 果 一 切 正常 ， 你 很 快 就 会 收 到 来 自 你 自己 的 一 封 邮件 。 





(require '[postal.core :refer [send-message]]) 


;; 用 你 自己 的 账户 口令 代替 下 面 的 
(def email "<<your gmail address>") 
(def pass "<your gmail password>") 


(def conn {:host "smtp.gmail.com" 
:ssl true 
:USer email 
:pass pass}) 


(send-message conn {:from email 
:to email 
:subject "A message, from the past" 
:body "Hi there, me!"}) 

;; -> {:error :SUCCESS, :code 0, :message "messages sent"} 








讨论 


有 了 可 敬 的 JavaMail 作为 核心 ，postal 就 没什么 可 担心 的 了 。 即 使 是 Gmail 饱 受 争议 的 认 


证 设置 也 可 以 用 一 个 :ss 键 来 解决 。 虽 然 对 于 简单 的 邮件 发 送 ， 我 们 一 般 会 





的 Java API， 但 我 们 更 喜欢 postal， 因 为 它 的 API 面向 的 是 数据 ， 而 不 是 对 象 。 
面向 数据 有 一 点 确实 很 棒 ， 就 是 指定 连接 细节 。send-message 函数 的 第 一 个 参数 是 (多 功 


会 已 
月 E 


Jy) 映射 表 ， 包 含 连接 细节 。 有 效 的 连接 细节 包括 : 
:host 
SMTP 服务 器 的 主机 名 。 如 果 本 地 运行 可 以 不 提供 。 





:port 


LE 议 试 试 原本 


SMTP 服务 器 的 端口 。 有 一 些 根据 上 下 文 的 默认 值 ， 包 括 在 设置 :ssl 时 使 用 465， 在 设 
置 :tls 时 使 用 25。 
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:USer 


用 于 认证 的 用 户 名 (如 果 要 求 认证 )。 


:pass 


用 于 认证 的 口令 (如果 要 求 认 证 )。 

















:ssl 


如 有 果 值 为 真 ， 使 用 SSL 加 密 。 


:tls 
如 果 值 为 真 ， 使 用 TLS 加 密 。 





如 果 没 有 提供 连接 细节 〈 要 么 省 略 了 第 一 个 参数 ， 要 么 传 入 了 nil)，postal 将 试图 把 邮件 
发 给 本 地 的 sendmail 实例 (http:Wen.wikipedia.org/wiki/Sendmail) 。 











因为 亚马逊 的 简单 邮件 服务 (Simple Email Service, SES) 支持 SMTP， 所 以 
可 以 利用 postaL， 通 过 亚马逊 的 基础 设施 来 发 送 邮件 。 





























与 连接 细节 类 似 ， 消 息 本 身 也 表示 为 简单 的 数据 映射 表 。 所 有 的 标准 头 都 通过 消息 键 支持 : 
。 发 件 人 选项 


mn :from 


mn :reply-to 


。 收 件 人 选项 


mn :CC 
a :bcc 
。 内 容 选项 
mn :subject 
mn :body 
。 元 数据 选项 
nm :date 
mn :message-id 


m :USer-agent 


除了 这 些 之 外 的 选项 将 附 在 消息 后 ， 作 为 辅助 的 头 信息 。 
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在 用 :to、:cc 或 :bcc 键 来 指定 收 件 人 时 ， 值 可 以 是 单个 地 址 ， 也 可 以 是 地 址 序列 : 





{:to "joe@example.com" 
:cc ["joe@example.com", "jim@example.com", "jeff@example.com"] 
:bcc "archive@example.com"} 


消息 体 可 以 指定 为 一 个 字符 串 ， 或 一 系列 部 分 的 映射 表 。 前 面 的 方式 发 出 简单 的 纯 文本 
邮件 ， 后 面 的 方式 发 出 多 部 分 的 MIME 消息 。MIME (多 目的 因特网 邮件 扩展 ) 是 一 种 标 
准 ， 人 允许 邮件 包含 附件 或 其 他 富 文 本 内 容 ， 如 HIML。 


部 分 映射 表 由 两 个 值 组 成 : :type 和 :content。 对 于 消息 体 的 部 分 ，:type 是 该 内 容 的 
MIME 类 型 ，:content 是 该 内 容 的 文本 表示 形式 。 例 如 ， 要 创建 一 条 消息 ， 既 包含 普通 文 
本 ， 又 包含 该 内 容 的 HTML 表示 : 








:body [:alternative 
{:type "text/plain" 
:content "You just won the lottery!"} 
{:type "text/html" 
:content "<html> 
<body> 
<p>You just <b>won</b> the Lottery!</p> 
</body> 
</html>"}] 


你 会 注意 到 ， 上 面 消 息 体 的 第 一 个 “部 分 ”实际 上 不 是 一 个 部 分 映射 表 ， 而 是 关键 
字 :atternative。 消 息 通常 以 “混合 ”模式 发 送 ， 告 诉 邮件 客户 端 ， 每 个 部 分 构成 了 整体 
消息 的 一 段 。 而 具有 :alternative 类 型 的 消息 则 告诉 客户 端 ， 每 个 部 分 都 表示 完整 的 消 
息 ， 但 使 用 不 同 的 格式 。 





如 果 需 要 发 送 复杂 的 多 部 分 消息 ， 并 需要 对 消息 的 创建 有 更 多 的 控制 ， 就 需 
要 用 原始 的 JavaMail API 来 构造 消息 。 











对 于 附件 ，:type 参数 的 行为 稍 有 不 同 ， 它 控制 了 附件 是 包含 在 内 (:intine)， 还 是 作为 
附件 〈:attachment)。 通 过 为 :content 键 提 供 一 个 File 对 象 ， 从 而 指定 附件 的 内 容 。 附 
件 内 容 的 类 型 和 名 称 通常 从 File 对 象 推 知 ， 但 它们 可 以 用 :content-type 和 :file-name 键 
来 履 写 。 


例如 ， 向 你 所 有 的 好 朋友 发 送 一 张 你 的 猫 的 照片 ， 看 起 来 可 能 是 这 样 的 : 





:body [{:type "text/plain" 
:content "Hey folks,\n\nCheck out these pictures of my cat!"} 
{:type :inline 
:content (File. "/tmp/lester-flying-photoshop") 
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:content-type "image/jpeg" 

:file-name "lester-flying.jpeg"} 

{:type :attachment 

:content (File. "/tmp/lester-upside-down.jpeg")}] 


。 JavaMail 的 API 文档 (https://javamail.java.net/nonav/docs/api/)。 


5.6 用 RabbitMQ 实 现 队 列 通 信 


作者 : Ryan Neufeld， 最 初 由 Michael Klishin 提交 


问题 
希望 在 一 些 应 用 之 间 通 过 外 部 队列 来 通信 ， 比 如 RabbitMQ (http://rabbitmq.com/)。 


解决 方案 


Langohr (http://clojurerabbitmq.info/) 是 一 个 小 RabbitMQ 客户 端 ， 用 它 与 RabbitMQ 通信 。 





在 开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [com.novemberain/Langohr "1.6.0"]， 或 用 Lein-try 
开始 REPL: 


$ lein try com.novemberain/Langohr 
为 了 继续 这 个 实例 ， 需 要 安装 并 运行 RabbitMQ (http://www.rabbitmq.com/download.html)。 
安装 完成 后 ， 用 命令 rabbitmq-server 来 启动 独立 的 RabbitMQ 服务 器 : 


$ rabbitmq-server 








在 对 RabbitMQ 执行 操作 之 前 ， 必 须 连 接 到 服务 器 ， 并 打开 通信 信道 。 信 道 是 中 介 ， 在 它 
上 面 产生 和 消费 消息 : 














(require "Langohr .core 
"Langohr .channel) 


;; 连接 到 本 地 RabbitMo 集群 结 点 ，LocaLhost:5672 
(def conn (langohr.core/connect {:hostname "localhost"})) 


;; 在 连接 上 打开 信道 
(def ch (Langohr .channeL/open conn)) 





在 RabbitMQ 中 ， 消 息 被 发 布 给 交换 器 ， 通 过 绑 定 路 由 到 队列 ， 最 终 被 消费 者 消费 。 有 几 
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种 不 同类 型 的 交换 器 ， 定 义 了 不 同 的 交付 语义 。 最 基本 的 交换 器 类 型 是 直接 (direct) ， 它 
根据 消息 的 路 由 键 (routing key) 来 路 由 消息 。 


要 在 生产 者 和 消费 者 之 间 建 立 管 道 ， 先 调用 langohr .queue/declare， 用 期 望 的 名 字 创 建 一 
个 队列 : 


尔 





RS 





(require '[langohr .queue :as Lq]) 
(def resize-queue "imaging.resize") 


(lq/declare ch resize-queue) 

;; -> {:queue "imaging.resize", 
:ConSsumer -count 0， 
:message_count 0， 

全 :consumer_count 0， 
:message-count 0} 


9 9 


注 池 


在 默认 情况 下 ，RabbitMQ 创建 空 交换 器 (一 个 空 字符 串 ) 和 每 个 队列 之 间 的 绑 定 。 现 在 
尔 可 以 通过 调用 Langohr .basic/publish "imaging.resize" 队列 发 送 消息 ， 参 数 是 信道 、 


直接 交换 、 路 由 键 (队列 的 名 字 ) 和 消息 : 


(lb/publish ch "" resize-queue "hello.jpg") 


要 从 队列 中 同步 地 消费 消息 ， 就 调用 Langohr .basic/get， 参 数 是 信道 和 队列 名 称 : 


(def hello-msg (lb/get ch resize-queue)) 


hello-msg 
;; -> [{:routing-key "imaging.resize", :headers nil ...} #<byte[] [B@2b195c88>] 


(String. (last hello-msg) "UTF-8") 
;; -> "hello.jpg" 





要 异步 地 消费 消息 ， 就 调用 Langohr .consumers/subscribe 来 订阅 队列 。 每 当 有 消息 发 布 给 
队列 时 ， 提 供给 subscribe 的 处 理 函 数 将 被 调用 : 


(require '[langohr.consumers :as lc]) 


(defn resize-image-handler 
"Spawn a resize process for each resize message received" 
[ch metadata ^bytes payload] 
(let [filename (String. payload "UTF-8")] 
(println (format "Resizing file %s" filename)))) 


;; 订阅 队列 ， 提 供 处 理 函 数 


(def tag (lc/subscribe ch resize-queue resize-image-handler)) 











;; 订阅 的 返回 值 是 一 个 订阅 标签 
tag 
; -> "amq.ctag-7hsNsSqLDEEoESSAkIC6XQ" 


洲 潜 
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(lb/publish ch "" resize-queue "hello-again.jpg") 
;3 oUt* 
;; Resizing file hello-again.jpg 


;; 通过 标签 来 取消 订阅 
(lb/cancel ch tag) 
讨论 
至 此 ， 你 已 经 了 解 了 利用 RabbitMQ 收发 消息 的 过 程 ， 但 这 仅仅 是 Langohr 和 RabbitMQ 


能 力 的 一 点 皮毛 。Langohr 是 一 个 小 型 RabbitMQ 客户 端 ， 它 包装 了 Java RabbitMQ 库 ， 支 
持 AMQP 0-9-1 以 及 RabbitMQ 对 AMQP 的 扩展 ， 并 提供 了 一 个 HTTP API 客户 端 。 








AMQP 0-9-1 及 其 扩展 实现 Langohr， 是 以 几 个 主要 概念 为 核心 的 : 交换 器 、 队 列 和 绑 定 。 


4 
法 
融 


交换 器 非常 像 一 个 邮局 : 当 消 息 发 布 给 交换 器 时 ， 交 换 器 将 它 路 由 给 一 个 或 多 个 队列 。 这 
些 消息 路 由 的 方式 ， 取 决 于 交换 器 的 类 型 ， 以 及 交换 器 和 队列 之 间 的 绑 定 。 


有 几 种 交换 器 的 类 型 ， 每 一 种 都 有 自己 的 交换 语义 ， 参 见 表 5-1。 可 以 创建 定制 的 交换 类 
型 ， 来 处 理 复杂 的 路 由 场景 〈 例 如， 根据 内 容 或 地 理 位 置 数据 来 路 由 ) ， 或 仅仅 为 了 方便 。 


表 5-1 内 建 的 交换 器 类 型 



































名 称 行为 预定 义 的 交换 
Direct 1: 1， 根据 路 由 键 来 路 由 

Fanout 1:N， 名 略 路 由 键 "amq.fanout" 
Topic 1:N， 考 虑 路 由 键 "amq. topic" 
Headers 1 :1， 考 虑 许多 头 部 "amq.match" 


要 声明 一 种 内 建 的 交换 器 ， 就 调用 Langohr.exchange/fanout、Langohr .exchange/topic、 
Langohr .exchange/direct 或 Langohr .exchange/headers。 每 个 国 数 都 提供 了 对 应 交换 器 类 
型 的 相关 选项 ， 最 终 调用 的 是 Langohr ,exchange/dectLare: 














(require '[Langohr .exchange :as Le]) 





;; 为 图 像 处 理 完成 创建 fanout 交换 器 


(le/fanout ch "imaging.complete") 











交换 器 有 一 些 关 联 属 性 : 


。 名 称 ; 
。 类 型 (direct、fanout、topic、headers， 或 某 种 定制 类 型 ) ; 
。 持久 性 〈 它 是 否 应 该 活 过 代理 重启 ? ) ; 
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。 不 再 使 用 时 ， 该 交换 器 是 否 被 自动 删除 ; 
。 定制 的 元 数据 (有 时 称 为 x-arguments)。 


用 Langohr .exchange/declare 可 以 直接 定制 这 些 属性 ， 创 建 自 己 的 交换 器 类 型 。 











队列 

队列 就 像 邮 局 中 的 邮箱 。Langohr.queue/dectare 国 数 创 建 命名 队列 。 除 名 称 外 ， 该 函数 
还 接受 一 些 关 键 字 参 数 来 调整 队列 的 属性 ， 包 括 队 列 是 否 :durable、:exclusive 或 :auto- 
delete。 其 他 的 参数 可 以 通过 :arguments 值 来 指定 。 








(lq/declare ch "imaging.transcode" :durable true) 

;; -> {:queue "imaging.transcode", ...} 
用 Langohr .queue/declare-server-named 畏 数 可 以 生成 具有 唯一 名 称 的 队列 。 该 国 数 与 
Langohr .queue/declare 类 似 ， 但 没有 名 称 参 数 : 


(lq/declare-server-named ch) 
;; -> "amq.gen-FcFv8JD9K8-4NuT8kC3jKA" 


不 像 交 换 器 ，RabbitMQ 中 的 队列 都 是 同样 的 类 型 。 


绑 定 
正如 你 在 解决 方案 中 看 到 的 ， 直 接 交 换 器 根据 名 称 ， 在 默认 的 交换 器 和 每 个 队列 之 间 建 立 
了 一 个 隐 含 的 绑 定 。 但 在 自然 环境 下 ， 队 列 通常 明确 地 与 交换 器 绑 定 。 可 以 调用 langohr. 
queue/bind 来 创建 自己 的 绑 定 ， 参 数 是 信道 、 队 列 名 称 和 交换 器 名 称 : 

;; 创建 唯一 的 完成 队列 …… 


(def completion-queue (lq/declare-server-named ch)) 


























;; 将 它 与 imaging.complete fanout 交换 器 绑 定 
(lq/bind ch completion-queue "imaging.complete") 
发 布 
用 langohr .basic/publish 函数 将 消息 发 布 到 交换 器 。 这 个 函数 有 以 下 三 个 主要 参数 
( 除 信 道外 )。 
。 交换 器 的 名 称 
要 么 是 用 户 生 成 的 交换 器 ， 如 "imaging.complete"， 或 是 内 建 的 交换 器 ， 如 "amq.fanout" 
或 UD 


。 路 由 键 
由 交换 器 使 用 ， 根 据 类 型 将 消息 路 由 给 队列 。 
。 消 息 


发 送 给 队列 的 消息 体 。 
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作为 可 选 参数 ，publLish 允许 用 户 指定 许多 消息 头 部 作为 关键 字 参 数 。 完 整 的 清单 参见 
publish 函数 的 文档 。 

消费 

声明 了 一 些 队列 后 ， 有 两 种 方式 从 队列 中 消费 消息 : 


。 拖拉 ， 用 langohr .basic/get，; 
。 推送 ， 用 Langohr .consumers/subscribe。 


在 推送 API 中 ， 可 以 同步 调用 get 函数 ， 从 队列 中 取得 一 条 消息 。get 的 返回 值 是 一 个 元 
数据 映射 表 的 三 元 组 和 一 个 消息 体 。 返 回 的 消息 体 是 一 个 字 市 数组 ， 要 得 到 普通 文本 消 
息 ， 可 以 用 字符 串 的 构造 方法 (String.)， 将 这 些 字 节 转换 成 字符 串 。 因 为 String 字 节 数 
组 的 编码 是 UTF-8， 所 以 在 调用 String 构造 函数 时 使 用 "UTF-8" 编码 选项 ， 这 很 重要 : 








(lb/publish ch "" resize-queue "hello.jpg") 

(let [[_ body] (lb/get ch resize-queue)] 
(String. body "UTF-8")) 

;; -> "hello.jpg" 


如 果 队 列 中 没有 消息 ，get 将 返回 nil。 


在 拖拉 API 中 ， 用 Langohr .consumers/subscribe 来 订阅 队列 ， 提 供 消息 处 理 函 数 ， 在 队列 
收 到 每 条 消息 时 调用 。 人 处理 函 数 调用 时 带 三 个 参数 : 信道 、 元 数据 和 消息 体 字 节 数 组 。 


;; 一 个 普通 的 处 理 函 数 
(defn resize-image-handler 
"Spawn a resize process for each resize message received" 
[ch metadata ^bytes payload] 
(let [filename (String. payload "UTF-8")] 
(println (format "Resizing file %s" filename)))) 








subscribe 是 不 阻塞 的 调用 ， 结 束 时 它 会 返回 一 个 标签 字符 串 ， 以 后 利用 这 个 字符 串 来 调 
用 Langohr .consumers/canceL， 实 现 取 消 订 阅 。 





subscribe 图 数 也 人 允许 指定 许多 队列 生命 周期 国 数 ， 在 Langohr .consumers/create-default 
文档 中 有 充分 的 描述 。 

确认 

被 消费 的 消息 需要 确认 。 这 可 以 自动 发 生 (只 要 消息 发 送 给 消费 者 ，RabbitMQ 就 认为 已 
确认 ) 或 手动 发 生 。 





消息 被 确认 后 ， 它 将 从 队列 中 删除 。 如 果 在 消息 确认 之 前 ， 信 道 意外 关闭 ，RabbitMQ 会 
自动 将 它 重新 放 入 队列 。 请 注意 ， 这 些 确认 具有 专门 针对 应 用 的 语义 ， 有 助 于 确保 消息 得 
到 正确 处 理 。 








在 手工 确认 时 ， 应 用 负责 确认 或 拒绝 消息 。 这 分 别 是 通过 Langohr.basic/ack 和 Langohr. 
basic/nack 完成 的 ， 每 个 函数 都 接受 一 个 元 数据 属性 ， 名 为 delivery-tag (发 送 ID)。 要 
启用 手工 确认 ， 在 调用 Langohr.consumers/subscribe 时 传人 :auto-ack false: 





(defn manual-ack-handler 
"Spawn a resize process for each resize message received" 
[ch {:keys [delivery-tag]} ^bytes payload] 
(try 
(String. payload "UTF-8") 
;; 做 一 些 工作 ， 然 后 确认 该 消息 
(lb/ack ch delivery-tag) 
(catch Throwable t 
;; 拒绝 该 消息 
(lb/nack ch delivery-tag)))) 























(lc/subscribe ch resize-queue manual-ack-handler :auto-ack false) 





请 注意 ， 如 果 将 消息 退回 队列 ， 而 队列 又 只 有 一 个 消费 者 ， 它 会 马上 重新 发 送 。 


在 收 到 一 条 确认 之 前 ， 也 可 以 控制 向 客户 端 推送 多 少 消 息 。 这 被 称 为 预先 取 设 置 ， 通 过 调 
用 Langohr .basic/qos 实现 。 这 个 设置 适用 于 整个 信道 : 




















;; 预先 取 一 打消 息 
(lb/qos ch 12) 








RabbitMQ 队列 也 可 以 在 集群 布点 之 间 镜 象 ， 实 现 高 可 用 性 ， 限 定 消息 的 长 度 或 超时 等 。 
更 多 的 信息 ， 参 见 RabbitMQ 和 Langohr 的 文档 网 站 。 


参阅 

。 Langohr 文档 (http://clojurerabbitmq.info/)。 

。 Langohr 的 API 参考 (http:/reference.clojurerabbitmq.info/) 。 

。 RabbitMQ 教程 (http://rabbitmq.com/getstarted.html)。 

。 如 果 需 要 低层 次 的 RabbitMQ 访问 ， 也 许可 以 研究 一 下 利用 Clojure 的 Java 互 操作 性 ， 
使 用 RabbitMQ 的 Java 客户 端 (http:/www.rabbitmq.com/java-client.html)，Langohr 正 是 
基于 这 个 库 。 


5.7 通过 MQTT 与 散 入 式 设备 通信 


作者 : Sandeep Nangia 





问题 
希望 用 发 布 /订阅 的 方式 ， 与 内 入 式 设备 通信 ( 想 想 “ 物 联网 ”)。 
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解决 方案 

使 用 Machine Head (https://github.com/clojurewerkz/machine_head)， 它 是 一 个 Clojure 库 ， 
通过 MQTT (http://mqtt.org/) 协议 实现 机 器 到 机 器 (M2M) 的 通信 。 该 协议 要 求 有 一 
个 MQTT 代理 ， 所 有 设备 (或 机 器 ) 通过 它 来 通信 ， 即 发 布 或 订阅 特定 主题 的 消息 。 可 
以 使 用 Mosquitto (http://mosquitto.org/) 代理 和 它 的 测试 用 安装 实例 ， 地 址 是 tep://test. 
mosquitto.org:1883 (当然 ， 你 的 机 器 需要 有 可 用 的 互联 网 连接 )。 








要 继续 这 个 实例 ， 请 用 lein-try 启动 REPL: 
$ lein try cLojurewerkz/machine_head 


开始 创建 一 个 简单 的 connect-and-subscribe 国 数 ， 监 听 一 个 主题 ， 并 打印 它 收 到 的 消息 : 





(require '[clojurewerkz.machine-head.client :as mh]) 


(defn message-handler [topic meta payload] 
(let [p (apply str (map char payload))] 
(println "received " p "on topic " topic))) 


(defn connect-and-subscribe [broker-addr topics subscriberid] 
(let [qos-levels (vec (repeat (count topics) 2)) ;; All at qos 2 
conn-sub (mh/connect broker-addr subscriberid)] 
(if (mh/connected? conn-sub) 
(do 
(mh/subscribe conn-sub topics message-handler {:qos qos-levels}) 
conn-sub)))) ;; Return conn-sub for later mh/disconnect... 


(def subscriberid (mh/generate-id)) 
;; Or use a unique id 
;; (def subscriberid "SNSubscriber01") 


(connect-and-subscribe "tcp://test.mosquitto.org:1883" 
["SNControlNetwork/Florida/device1"] subscriberid) 

















打开 另 一 个 终端 窗口 ， 启 动 第 二 个 lein-try REPL 会 话 。 利 用 下 面 的 代码 向 代理 发 布 消 
息 。 请 注意 ， 订 阅 者 必须 已 经 连接 ， 这 样 才 不 会 丢失 传 来 的 消息 : 




















(require '[clojurewerkz.machine-head.client :as mh]) 


(defn connect-and-publish [broker-addr client-id topic] 
(let [qos 2 
retained false 
conn (mh/connect broker-addr client-id)] 
(if (mh/connected? conn) 
(do (dotimes [n 5] 
(let [payload (str "msg" n)] 
(mh/publish conn topic payload qos retained) 
(println "published " payload))) 
(mh/disconnect conn))))) 
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(def pubclientid (mh/generate-id)) 


pubclientid 


;; -> "ryan.1384135173618" 


(connect-and-publish "tcp://test.mosquitto.org:1883" pubclientid 
"SNControlNetwork/Florida/device1") 
;; *out* of publish REPL 


;; published 
;; published 
;; published 
;; published 
;; published 


msg0 
msg1 
msg2 
msg3 
msg4 


;; *out* of client REPL 


;; received 
;; received 
;; received 
;; received 
;; received 


讨论 


MQTT (http://mqtt.org/) 是 玫 


msg0 on 
msg1 on 
msg2 on 
msg3 on 
msg4 on 


topic SNControlNetwork/Florida/devicel 
topic SNControlNetwork/Florida/devicel 
topic SNControlNetwork/Florida/devicel 
topic SNControlNetwork/Florida/devicel 
topic SNControlNetwork/Florida/devicel 


F 放 的 、 轻 量 级 的 发 布 /订阅 消息 协议 。 它 适用 于 带宽 很 珍贵 





或 连接 不 可 靠 的 情况 。AMQP 协议 在 商业 消息 的 各 种 场景 下 有 优势 ， 入 WT 对 是 


小 负载 和 最 后 一 公里 的 选择 ， 





得 它 适用 于 受 限制 的 网 络 。 


。 针对 资源 有 限 的 设备 而 设计 ， 例 如 电池 驱动 的 8 位 控制 器 。 

。 内 部 压缩 成 以 位 计 的 头 和 可 变 长 的 字段 。 包 的 最 小 可 能 大 小 只 有 2 字 市 。 
。 不 需要 轮 询 。 实 现 异 步 双向 消息 推送 。 

。 支持 常 连接 和 有 时 连接 两 种 模式 。 

。 在 低 带 宽 网 络 中 测试 





因为 它 容易 在 硬件 中 实现 。MQTT 协议 具有 以 下 的 属性 ， 使 








试 过 ， 如 VSAT 和 GPRS。 


该 协议 定义 了 3 种 可 能 的 服务 质量 (QoS) 值 : 9、1 和 ?2， 济 趴 寺 澡 过 且 不 管 、 至 少 一 次 
和 刚好 一 次 的 服务 质量 。QoS 参数 1 和 2 要 求 客户 端 有 持久 存储 ， 这 样 才能 保存 消息 ， 直 


到 收 到 确认 。 在 上 


























押 的 实例 中 ， 使 用 的 库 提 供 了 默认 的 持久 实现 。 








MQTT 也 有 消息 保留 的 概念 
true， 代 理 将 记 住 该 主题 最 后 一 条 保留 消息 。 在 订阅 者 连接 时 ， 代 理 将 发 给 它 最 后 一 条 消 
息 (该 消息 的 retained 为 true)， 不 必 等 待 接 收 下 一 条 消息 。 





broker) 。 





。 如 果 在 connect-and-publish 函数 中 将 retained 设置 为 

















WebSphere 和 RabbitMQ (http://www.rabbitmq.com/mqtt.html) 也 实现 了 MQTT， 
可 以 替代 Mosquitto。 虽 然 前 面 的 代码 使 用 的 是 Mosquitto 测试 代理 (tcp:// 
test.mosquitto.org:1883)， 但 也 可 以 安装 自己 的 Mosquitto 代理 ， 参 阅 MQTT 安 
装 说 明 (https://github.com/mqtt/mqtt.github.io/wiki/doku.php/mosquitto_message_ 
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主题 常常 用 分 隔 符 /来 定义 层级 关系 。 例 如 ， 某 个 领域 SNControl 的 传感器 设备 可 能 将 它 
们 的 值 发 布 到 SNControL/FLorida/device1、SNControL/FLorida/device2 等 主题 。 同 时 ， 领 
域 RKNControl 的 设备 可 能 将 它们 的 值 发 布 到 RKNControl/Washington/devicel 等 主题 。 以 
这 种 方式 命名 主题 有 助 于 利用 通配符 订阅 多 个 主题 。 























下 面 是 通配符 的 用 法 。 








。 / 
用 作 分 隔 符 。 





。 十 


单 层 通配符 ， 可 以 出 现在 字符 串 的 任何 地 方 。 


. 
并 





多 层 通配符 ， 需 要 出 现在 字符 串 的 末尾 。 





例如 ， 可 能 有 下 面 的 订阅 。 


。 SNControl/# 
在 SNControl/Florida 下 的 所 有 设备 (如 SNControL/FLorida/device1/sensor1 和 SNControl/ 
Florida/device1/sensor2) 以 及 SNControl/California/devicel 将 匹配 。 





。 SNControL/+/device1 
所 有 州 中 在 SNControl 领域 下 的 devicel 将 匹配 (如 SNControl/Florida/devicel 和 SNControl/ 


California/devicel), 


。 SNControL/+/+/sensor1 


所 有 州 中 在 SNControl 下 的 sensor1 将 匹配 (如 SNControl/Florida/devicel/sensorl 和 
SNControl/Florida/device2/sensor1), 











在 前 面 的 代码 中 ，connect-and-subscribe 方法 使 用 了 回调 处 理 函 数 message-handler 来 处 
理 从 代理 接收 到 的 消息 。 在 connect-and-subscribe 方法 中 ，Machine Head 库 的 connect 
方法 调用 时 ， 提 供 了 代理 的 地 址 和 客户 端 ID (通过 generate-id 生成 ， 或 其 他 某 种 唯一 
ID)。 然 后 它 用 connected? 方法 检查 连接 是 否 已 经 建立 。 调 用 subscribe 方法 时 ， 参 数 是 
连接 、 包 含 订阅 主题 的 向 量 、 消 息 处 理 函 数 和 :qos 选项 。 然 后 订阅 者 等 待 一 段 时 间 ， 用 
disconnect 方法 断 开 连 接 。 





















































connect-and-publish 方法 调用 了 connect 方法 ， 后 者 接受 代理 地 址 和 客户 端 ID 作为 参数 ， 
返回 连接 conn。 然 后 它 用 connected? 方法 检查 连接 是 否 成 功 ， 并 调用 publish 方法 向 代理 
发 布 消息 (发 了 几 次 )。publish 方法 接受 的 参数 是 连接 、 主 题字 符 串 、 消 息 体 、Qo5S 值 和 
retained。QoS 值 2 对 应 于 “刚好 一 次 ”发 送 。retained 值 为 false 告诉 代理 不 要 保留 消 














A 


218 | 第 5 章 


息 。 最 后 ，disconnect 方法 断 开 与 代理 的 连接 。 








虽然 前 面 的 代码 片段 只 是 打印 出 收 到 的 消息 ， 但 你 可 以 用 别 的 方式 来 使 用 这 些 消息 〈 例 
如 ， 根 据 代码 收 到 的 警报 触发 某 些 动作 )。 














参阅 

。 MQTIT 协议 网 站 (http://mqtt.org/)。 

。 Machine Head 库 (https://github.com/clojurewerkz/machine_head) 的 文档 (http://clojuremqtt. 
info/) 。 

。 Eclipse Paho 库 (http://www.eclipse.org/paho/) ，Machine Head 底层 使 用 这 个 Java 库 实现 
MGQTT 通信 。 

。 Mosquitto (http://mosquitto.org/) ， 实 现 了 MQTT 协议 的 开源 消息 代理 。 

。 Building Smarter Planet Solutions with MOTT and IBM WebSphere MO Telemetry (http:// 
www.redbooks.ibm.com/abstracts/sg248054.html, IBM 红皮书 )， 作 者 Valerie Lampkin 等 ， 
该 书 更 详细 地 解释 了 MQTT。 

。 Andy Stanford-Clark 的 TED 演讲 (http:/www.youtube.com/watch?v=s9nrm8q5eGg)， 他 
是 MQTT 发 明 者 之 一 ， 该 演讲 风格 幽默 而 信息 丰富 ， 探 讨 了 如 何 使 用 MQTT。 


5.8 并 发 使 用 ZeroMQ 


作者 : Kevin J. Lynagh 
































问题 
希望 并 发 地 使 用 ZeroMQ， 但 ZeroMQ 套 接 字 对 线程 来 说 不 是 安全 的 。 可 以 利用 锁 或 其 他 
Java 并 发 原 语 手工 建立 互 斥 访问 ， 但 你 可 能 希望 使 用 更 简单 的 方法 。 


解决 方案 
用 zmq-async (https://github.com/lynaghk/zmq-async) 库 ， 利 用 core.async 来 简化 ZeroMQ 
的 并 发 使 用 。 


为 了 继续 本 实例 ， 你 的 系统 应 该 安装 ZeroMQ 3.2。 如 果 系 统 是 Mac 并 安装 了 Homebrew 
(http:Wbrew.sh/) 包 管 理 器 ， 用 下 面 的 命令 来 安装 它 : 









































$ brew install zeromq 


或 者 ， 在 Ubuntu 系统 上 : 


$ apt-get install libzmq3 
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或 者 ,访问 BMQ 的 下 载 页 面 (http://zeromq.org/intro:get-the-software)。 


在 开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [com.keminglabs/zmq-async "0.1.0"]， 或 用 Lein- 
try 开始 REPL: 





$ lein try com.keminglabs/zmq-async 











Tn 





下 面 是 用 core.async 中 的 两 个 异步 go 语句 块 进行 简单 的 来 回 通信 ， 通 过 ZeroMQ 的 进程 
内 套 接 字 进 行 。 








(require '[com.keminglabs.zmq-async.core :refer [register-socket!]] 
'[clojure.core.async :refer [>! <! go chan sliding-buffer close!]]) 


(def addr "inproc://ping-pong") 


(def server-in (chan (sliding-buffer 64))) 
(def server-out (chan (sliding-buffer 64))) 
(def client-in (chan (sliding-buffer 64))) 
(def client-out (chan (sliding-buffer 64))) 


(register-socket! {:in server-in 
:out server-out 
:socket-type :rep 
:configurator (fn [socket] (.bind socket addr))}) 


(register-socket! {:in client-in 
:out client-out 
:socket-type :req 
:configurator (fn [socket] (.connect socket addr))}) 








(do 
;; 一 个 简单 的 服务 器 工作 者 ， 等 待 进来 的 请 求 ， 回 应 以 "pong" 
(go 


(dotimes [_ 3] 
(println (String. (<! server-out))) 
(>! server-in "pong")) 

(close! server-in)) 





;; 一 个 简单 的 客户 端 工作 者 ， 发 出 "ping" 请 求 ， 等 和 
(go 
(dotimes [_ 3] 
(>! client-in "ping") 
(println (String. (<! client-out)))) 
(close! client-in))) 
;; *OUt* 
;; ping 
;，; pong 
;; ping 
;，; pong 
;; ping 
;，; pong 








sl 





应 











讨论 

ZeroMQ 是 面向 消息 的 套 接 字 系统 ， 在 多 种 传输 层 (进程 内 、 进 程 间 、 机 器 间 通 过 TCP 
等 ) 上 支持 多 种 通信 方式 (请求 / 应 答 、 发 布 /订阅 等 )， 与 多 种 语言 绑 定 。ZeroMQ 套 接 
字 提 供 了 很 好 的 基础 ， 来 构建 面向 服务 的 架构 。ZeroMQ 的 套 接 字 比 HTTP 的 开销 小 ， 在 
架构 上 更 灵活 ， 除 了 请 求 / 应 答 之 外 ， 还 支持 发 布 /订阅 、 扇 出 和 其 他 拓扑 结构 。 


但 是 ，ZeroMQ 套 接 字 对 线程 来 说 不 是 安全 的 ， 并 发 使 用 通常 需要 明确 加 锁 ， 或 专门 的 线 
程 和 队列 。zmq-async 库 解 决 了 这 些 问题 ， 替 你 创建 了 ZeroMQ 套 接 字 ， 让 你 通过 线程 安 
全 的 core.async 信道 来 访问 它们 。 





zmq-async 库 提 供 了 一 个 函数 com.keminglabs.zmq-async.core/register-socket!， 它 将 
ZeroMQ 套 接 字 与 一 个 或 两 个 core.async 信道 关联 起 来 : :in (可 以 向 它 写 入 字符 串 或 字 
节 数 组 ) 和 :out (可 以 从 它 读 取 字 节 数 组 )。 用 >! 写 入 Clojure 字符 串 集合 或 字 节 数组 时 ， 
发 出 一 条 多 部 分 消息 。 收 到 的 多 部 分 消息 放 在 core.async 信道 中 。 用 <! 读 取 这 些 消息 ， 
将 得 到 一 个 包含 字 市 数组 的 向 量 。 











为 了 模拟 两 个 异步 进程 通过 ZeroMQ 交互 ， 前 面 的 例子 用 了 两 个 go 语句 块 ， 通 过 注册 的 
信道 读 写 消息 。 每 个 go 语句 块 都 会 在 后 台 线 程 中 立即 开始 执行 。 “服务 器 ”语句 块 将 等 待 
并 应 答 三 次 请 求 (<! 会 阻塞 ， 直 到 它 接收 到 值 )， 每 次 都 应 答 “pong"。 同 时 ,“ 客 户 端 ” 
语句 块 将 发 起 三 次 “ping” 请 求 ， 每 次 都 会 等 到 应 答 后 再 发 出 下 次 请 求 。 最 后 ， 在 两 个 语 
句 块 完成 了 工作 之 后 ， 各 自用 close! 关闭 了 信道 。 






































register-socket! 函数 可 以 接受 一 个 已 经 创建 的 ZeroMQ 套 接 字 ， 但 通常 你 会 通过 传 
入 :socket-type 和 :configurator， 利 用 该 库 创 建 一 个 套 接 字 。configurator 是 一 个 函数 ， 

痰 受 原始 的 ZeroMQ 套 接 字 对 象 。 该 函数 在 套 接 字 创 建 之 后 运行 ， 以 便 连 接 / 绑 定 地 址 ， 
设置 pub/sub 订阅 ， 或 配置 该 套 接 字 。 











支持 register-socket! 的 隐 信 上下文 一 次 只 能 处 理 一 条 进 或 出 的 消息 。 如 
果 你 需要 多 个 套 接 字 并 行 工 作 (例如 ， 你 不 希望 因为 在 另 一 个 套 接 字 上 读 取 
10 GB 的 消息 ， 而 错失 一 条 小 小 的 控制 消息 )， 那 就 需要 多 个 zmq-async 上 
下 文 。 





























参阅 

Rich Hickey 的 “Language of the System” 演 讲 (http://www.youtube.com/watch?v=ROor6_ 
NGIWU,), 其 中 他 概括 了 队列 的 好 处 。 

ZeroMQ 指南 (http://zguide.zeromq.org/) 介绍 了 架构 模式 和 建议 。 

。 3.11 节 “ 用 core.async 解除 消费 者 和 生产 者 的 耦合 ”。 
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。 core.async 的 介绍 性 博客 文章 (http:/clojure.com/blog/2013/06/28/clojure-core-async- 
channels.html) ， 提 供 了 很 好 的 概述 。 


5.9 创建 TCP 客 户 端 


作者 : Luke VanderHart 


问题 
希望 与 远程 主机 的 特定 端口 建立 TCP 连接 。 


解决 方案 


利用 Java 互 操作 性 创建 java.net.Socket 实例 ， 连 接 到 远程 主机 。 





A 





例如 ， 下 面 的 代码 利用 Socket 创建 一 个 TCP 连接 ， 并 发 送 HTTP GET 请 求 ， 将 结果 以 字 
符 串 的 形式 返回 : 








(require '[clojure.java.io :as io]) 
(import '[java.io StringWriter] 
'[java.net Socket]) 


(defn send-request 

"Sends an HTTP GET request to the specified host, port, and path" 

[host port path] 

(with-open [sock (Socket. host port) 
writer (io/writer sock) 
reader (io/reader sock) 
response (StringwWriter.)] 

(.append writer (str "GET " path "\n")) 
(.fLush writer) 

(io/copy reader response) 

(str response))) 


这 个 函数 取得 java.io.Writer 和 java.io.Reader 实例 ， 向 远程 服务 器 发 送 数据 ， 并 从 服务 
器 接收 数据 。 通 过 拼接 满足 HTTP 规范 的 字符 串 并 写 入 writer 对 象 ， 它 形成 了 一 个 最 基本 
的 HTTP 客户 端 ， 向 指定 的 服务 端口 发 出 GET 请 求 。 然 后 利用 工具 函数 clojure.java.io/ 
copy， 将 结果 复制 到 java.io.sStringwriter 实例 ， 并 作为 字符 串 返 回 。 




















在 REPL 中 调用 (send-request "googtLe.com"” 80 "/") 将 返回 一 个 非常 长 的 字符 串 ， 包 含 
访问 Google 主页 时 的 整个 HTTP 响应 。 


讨论 


这 个 例子 利用 clojure.java.io 命 名 空间 得 到 了 java.io.Writer 和 java.io.Reader 实例 ， 
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实现 通过 网 络 套 接 字 读 写 文本 数据 。 事 实 上 ， 套 接 字 实例 并 非 真 的 对 文本 数据 有 所 限制 ， 
而 且 也 可 以 通过 clojure.java.io/input-stream 和 clojure.java.io/output-stream， 很 容 
易 地 获取 原始 的 二 进 制 输入 输出 流 。 但 因为 HTTP 是 一 个 文本 协议 ， 所 以 利用 Reader 和 
Writer 的 高 层 特性 更 有 意义 。 








这 个 例子 使 用 HTTP 是 因为 它 是 很 多 读者 熟悉 的 协议 。 在 真实 世界 中 ， 使 用 
原始 的 TCP 套 接 字 来 发 出 HITP 请 求 几 乎 肯定 是 糟糕 的 想法 。 有 些 库 提 供 了 
更 高 层 的 接口 ， 实 现 了 HTTP 的 请 求 和 应 答 ， 封 装 了 许多 麻烦 的 细节 ， 诸 如 
转 义 (escaping)、 编 码 和 格式 等 。 









































还 要 注意 reader、writer 和 套 接 字 本 身 都 在 with-open 宏 的 上 下 文 之 中 。 这 确保 了 它们 的 工 
作 结 束 时 ， 会 调用 close 方法 ， 释 放 TCP 连接 。 如 果 连 接 不 释放 ， 它 将 继续 消耗 客户 端 和 
服务 器 端的 资源 ， 可 能 需要 远 端 来 终止 它 。 





如 果 在 with-open 上 下 文中 返回 惰性 序列 ， 要 用 doall 来 完全 实现 这 些 序列 ， 这 一 点 很 重 
要 。 这 是 因为 with-open 打开 的 资源 仅 在 with-open 语句 块 中 可 用 。doall 函数 完全 实现 一 
个 集合 ， 返 回 它 在 内 存 中 的 全 部 内 容 : 














(realized? (range 100)) 
;; -> false 


(realized? (doall (range 100))) 

;; -> true 
根据 有 具体 的 应 用 ， 你 可 能 倾向 于 用 doseq 宏 。 除 了 保持 整个 序列 外 ，doseq 对 序列 中 的 每 
个 元 素 执行 它 的 语句 体 。 如 果 需 要 对 序列 中 的 每 个 元 素 产 生 副作用 ， 这 就 很 有 用 ， 但 需要 
坚持 做 完 所 有 的 事情 : 








(doseq [n (range 3)] 
(println n)) 
;; *OUt* 


参阅 
。 5.10 节 “ 创 建 TCP 服务 器 ”。 
。 TCP 协议 的 维基 百科 (http://en.wikipedia.org/wiki/Transmission_Control_Protocol) 。 


5.10 ”创建 TCP 服 务 器 


作者 : Luke VanderHart 
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问题 
希望 在 一 个 端口 打开 套 接 字 ， 作 为 低级 TCP 服务 器 。 


解决 方案 
利用 Java 的 互 操 作 性 和 java.net.ServerSocket 类 ， 创 建 TCP 监听 者 。 利 用 clojure. 
java.io 中 的 函数 来 获取 输入 输出 流 (或 reader 和 writer 对 象 ) ， 通 过 套 接 字 读 写 数据 : 








(require '[clojure.java.io :as io]) 
(import '[java.net ServerSocket]) 


(defn receive 
"Read a line of textual data from the given socket" 
[socket] 
(.readLine (io/reader socket))) 


(defn send 
"Send the given string message out over the given socket" 
[socket msg] 
(let [writer (io/writer socket)] 
(.write writer msg) 
(.fLush writer))) 


(defn serve [port handler] 
(with-open [server-sock (ServerSocket. port) 
sock (.accept server-sock)] 
(let [msg-in (receive sock) 
msg-out (handler msg-in)] 
(send sock msg-out)))) 


这 段 代码 定义 了 三 个 函数 。receive 和 send 负责 利用 套 接 字 读 取 和 写 入 字符 串 数 据 ， 用 到 


了 clojure.java.io/reader 和 clojure.java.io/writer 国 数 。 它 们 都 接受 java.net.Socket 
作为 参数 ， 返 回 从 大, 接 字 的 输入 和 输出 流 构 造 的 java.io.Reader 和 java.io.Writer。 


erver 负责 在 特定 端口 创建 ServerSocket 实例 。 它 也 接受 一 个 处 理 函 数 ， 该 函数 将 用 于 处 
进入 的 请 求 ， 决定 响应 的 消息 。 








a 




















证 


在 创建 了 ServerSocket 实例 后 ，server 马上 调用 它 的 accept 方法 ， 它 将 阻塞 ， 直 到 TCP 
连接 建立 。 当 客户 端 连 接 时 ， 它 以 java.net.Socket 实例 的 形式 返回 该 会 话 。 


然后 它 将 套 接 字 传递 给 receive 函数 ， 该 函数 在 套 接 字 上 打开 直到 接 
收 到 一 行 完 整 的 输入 ， 以 换行 符 〈\n) 结束 。 在 它 接收 到 一 行 时 ， 它 会 用 收 到 的 值 来 调用 
处 理 函 数 ， 利 用 在 同一 个 套 接 字 上 打开 的 writer 对 象 ， 调 用 send ey send 也 调 
用 writer 对 象 的 fLush 方法 ， 确 保 所 有 数据 真正 发 送 回 客户 端 ， 而 不 是 放 在 Writer 实例 的 
缓存 中 。 
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在 发 送 完 响应 后 ，serve 方法 返回 。 因 为 它 在 创建 服务 器 套 接 字 和 TCP 会 话 套 接 字 时 用 了 
with-open 宏 ， 所 以 在 返回 之 前 ， 它 会 对 这 些 套 接 字 调 用 close 方法 ， 断 开 客户 端 并 终止 


会 话 。 





























如 果 要 尝试 一 下 ， 请 在 REPL 中 调用 serve 函数 。 一 个 简单 的 例子 ， 就 用 (serve 8888 
#( .toUpperCase %))。 注 意 ， 它 不 会 马上 返回 ， 而 是 会 阻塞 ， 等 待 客 户 端 连接 。 





要 连接 服务 器 ， 可 以 使 用 telnet 客户 端 ， 几 乎 在 所 有 操作 系统 上 ， 它 都 是 默认 安装 的 。 要 
用 它 ， 就 打开 命令 行 窗口 : 


$ telnet localhost 8888 
Trying ::1... 

Connected to localhost. 
Escape character is '^]'. 





这 时 你 可 以 输入 任何 内 容 (在 下 面 的 例子 中 ,输入 是 “Hello, World!”)。 在 完成 输入 后 ， 
确保 按 下 回 车 键 来 发 送 换 行 字符 : 











$ telnet localhost 8888 

Trying ::1... 

Connected to localhost. 

Escape character is '^]'. 

Hello, World! 

HELLO, WORLD!Connection closed by foreign host 


你 会 看 到 ， 当 你 输入 换行 时 ， 服 务 器 的 响应 是 你 的 输入 的 大 写 版 本 (由 于 处 理 函 数 的 原 
因 )， 然 后 马上 终止 了 连接 。 在 REPL 中 ， 你 会 看 到 serve 函数 终于 返回 了 。 


讨论 
这 个 例子 使 用 了 reader 和 writer 对 象 ， 它 们 只 处 理 文本 数据 ， 这 是 为 了 让 使 用 套 接 字 的 
概念 更 容易 展示 。 当 然 ， 实 际 的 套 接 字 不 限于 字符 串 ， 可 以 发 送 和 接收 任何 类 型 的 二 进 
制 数据 。 




















要 做 到 这 一 点 ， 只 要 使 用 clojure.java.io/input-stream 和 clojure.java.io/output-stream 
国 数 ， 而 不 是 clojure.java.io/reader 和 clojure.java.io/writer 国 数 。 它 们 将 返回 
java.io.InputStream 和 java.io.0utputStream 对 象 。 这 些 对 象 提 供 了 读 写 原始 字 节 的 
API， 而 不 只 是 读 取 字 符 串 和 字符 。 





























关于 这 个 例子 ， 你 可 能 注意 到 了 一 件 事 ， 即 它 不 像 传统 的 服务 器 ， 在 serve 函数 返回 后 ， 
蕊 不 再 继续 接受 连接 请 求 。 要 持续 使 用 ， 通 常 你 会 希望 它 能 服务 多 个 连接 请 求 。 




















幸运 的 是 ， 有 了 Clojure 提供 的 并 发 工具 ， 这 是 比较 容易 的 。 将 serve 函数 改 成 持续 工作 的 
服务 器 ， 需 要 三 处 改动 : 
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。 在 独立 的 线程 中 运行 服务 器 ， 这 样 就 不 会 阻塞 REPL; 
。 在 处 理 完 第 一 个 请 求 后 ， 不 要 关闭 服务 器 套 接 字 ， 
。 在 处 理 完 请 求 后 ， 马 上 循环 处 理 下 一 个 请 求 。 





而 且 ， 由 于 服务 器 将 运行 在 REPL 之 外 的 线程 中 ， 所 以 好 的 做 法 是 提供 一 种 机 制 来 终止 服 
务 器 ， 而 不 是 终止 整个 JVM。 修 改 后 的 代码 是 这 样 的 : 


(defn serve-persistent [port handler] 
(let [running (atom true)] 
(future 
(with-open [server-sock (ServerSocket. port)] 
(while @running 
(with-open [sock (.accept server-sock)] 
(let [msg-in (receive sock) 
msg-out (handler msg-in)] 
(send sock msg-out)))))) 
running)) 


这 段 代码 的 主要 特点 是 ， 它 在 一 个 future 语句 块 中 异步 启动 了 服务 器 套 接 字 ， 并 在 一 个 循 
环 中 调用 accept 方法 。 它 也 创建 了 一 个 名 为 running 的 原子 类 型 ， 并 返回 它 ， 在 每 次 循环 
中 都 检查 它 。 要 停止 服务 器 ， 只 要 将 它 设 为 fatse， 循 环 就 会 中 止 ; 











(def a (serve-persistent 8888 #(.toUpperCase %))) 
;; -> #'my-server/a 





;; 服务 器 在 运行 ， 将 响应 多 个 请 求 


(reset! a false) 
;; -> false 


;; 服务 器 停止 了 ,不 再 响应 下 一 个 请 求 





何 时 使 用 套 接 字 


在 这 些 例子 中 可 以 看 到 ,原始 的 服务 器 套 接 字 是 相当 低层 的 网 络 构 造 。 要 有 效 使 用 它 
们 就 意味 着 要 么 创建 自己 的 数据 协议 ， 要 么 重新 实现 已 有 的 数据 协议 ， 而 且 要 自己 处 
理 所 有 费时 累 人 的 连接 、 清 空 缓 存 、 断 开 输 入 输出 流 等 工作 。 


如 果 你 的 通信 需要 满足 已 有 的 协议 或 通信 技术 (如 HTTP、SSH 或 消息 队列 ) ， 那 么 几 
了 乎 肯定 应 该 直接 使 用 它们 。 这 些 协议 有 许多 可 用 的 服务 器 和 库 ， 可 以 在 较 高 的 抽象 层 
次 上 编程 ， 具 有 更 好 的 性 能 和 弹性 

但 是 ， 理 解 这 些 不 同 技术 的 底层 工作 原理 仍然 是 有 价值 的 。 至 少 在 JVM 中 ， 大 多 

网 络 代码 最 终 都 归结 为 调用 本 实例 描述 的 原始 套 接 字 机 制 。 要 理解 高 级 网 络 工 具 ， 
HTTP 请 求 或 JMS 队列 ) 的 工作 原理 ， 先 理解 套 接 字 的 工作 原理 是 很 关键 的 。 











参阅 


。 Java 的 ServerSocket 和 Socket 对 象 的 API 文档 (http://docs.oracle.com/javase/7/docs/api/ 


java/neUServerSocket.html) 。 


。 ctLojure.java.io 命名 空间 的 API 文档 (http://clojure.github.io/clojure/clojure.java.io-api. 
html) 。 
。 5.9 市 “创建 TCP 客户 端 ”。 





5.11 收发 UDP 包 


作者 


: Luke VanderHart 


问题 
应 用 需要 发 送 或 接收 异步 的 UDP 包 。 


解决 方案 


利用 Java 互 操作 性 以 及 java.net.DatagramSocket 和 java.net.DatagramPacket 类 ， 发 送 和 





接收 





UDP 消息 。 


下 面 的 例子 展示 了 实现 收发 短 字 符 串 的 函数 ， 这 些 字符 串 被 编码 成 UDP 包 : 











(import '[java.net DatagramSocket 
DatagramPacket 
InetSocketAddress]) 


(defn send 
"Send a short textual message over a DatagramSocket to the specified 
host and port. If the string is over 512 bytes long, it will be 
truncated." 
[^DatagramSocket socket msg host port] 
(let [payload (.getBytes msg) 
length (min (alength payload) 512) 
address (InetSocketAddress. host port) 
packet (DatagramPacket. payload Length address)] 
(.send socket packet))) 


(defn receive 
"Block until a UDP message is received on the given DatagramSocket, and 
return the payload message as a string." 
[^DatagramSocket socket] 
(let [buffer (byte-array 512) 
packet (DatagramPacket. buffer 512)] 
(.receive socket packet) 
(String. (.getData packet) 


关于 TCP 协议 的 维基 百科 (http://en.wikipedia.org/wiki/Transmission_Control_Protocol)。 
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0 (.getLength packet)))) 


(defn receive-loop 


"Given af 


unction and DatagramSocket, will (in another thread) wait 


for the socket to receive a message, and whenever it does, will call 
the provided function on the incoming message." 


[socket f] 
(future (w 


send 国 数 相当 简 生 





hile true (f (receive socket))))) 


和 ， 因 为 它 的 大 部 分 内 容 都 是 构造 一 个 字 市 数组 ， 作 为 DatagramPacket 的 





负载 ， 并 调用 构造 方法 。 最 有 趣 的 是 负载 大 小 限制 为 512 字 节 ， 利 用 了 DatagramPacket 构 
造 方法 的 length 参数 。 因 为 在 一 个 UDP 包 中 发 送 超过 512 字 节 的 负载 ， 通 常 不 安全 。 虽 
然 某 些 网 络 基础 设施 可 能 支持 ， 但 另 一 些 并 不 支持 。 














receive 国 数 创 建 了 接收 数据 的 字 节 数组 ， 将 它 添 加 到 可 修改 的 空 DatagramPacket 实例 
中 ， 并 对 套 接 字 调用 DatagramSocket.receive 方 法。 在 收 到 数据 时 ，receive 方法 将 填充 
DatagramPacket 实例 并 返回 。 然 后 这 上段 Clojure 代码 利用 填充 的 字 节 数组 的 范围 ( 即 0 到 
DatagramPacket.getLength 方法 返回 的 值 )， 构 造 并 返回 新 的 String。 











因为 receive 函数 会 阻塞 ， 而 且 只 返回 一 个 值 ， 所 以 在 接受 多 条 消息 或 在 REPL 中 使 用 时 ， 
它 不 是 特别 有 用 。receive-loop 包装 了 receive 函数 ， 在 一 个 独立 的 线程 中 反复 调用 它 。 
如 果 它 返回 值 ， 就 调用 提供 的 函数 ， 然 后 循环 等 待 更 多 的 输入 。 





要 执行 这 段 代码 ， 


(def socket 




















首先 要 创建 DatagramSocket 实例 ， 在 REPL 中 : 


(DatagramSocket. 8888)) 


;; -> #'udp/socket 


在 指定 的 端口 (这 里 是 8888) 创建 UDP 套 接 字 。 





接 下 来 ， 用 receive-loop 国 数 启动 一 个 监听 者 。 对 于 这 个 例子 ， 只 要 传人 println 函数 ， 
就 能 打印 出 所 有 收 到 的 值 : 





(receive-loop socket println) 
;; -> #<core$future_call$reify 6267@2783890e: :pending> 


然后 就 可 以 发 送 消 息 了 ! 如 果 用 receive-loop 启动 监听 线程 无 误 ， 应 该 马上 就 能 看 到 打印 


出 收 到 的 消息 : 


(send socket 
OU 下 和 

;; hello, wo 
33 


;; -> nil 


这 个 例子 是 发 送 到 
到 了 。 








"hello, world!" "localhost" 8888) 


rld! 


jlocalhost， 消 息 传递 非常 快 ， 以 至 于 send 函数 还 没 返 回 ， 消 息 就 已 经 收 
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讨论 

不 像 TCP，UDP (用 户 数据 报 协议 ) 是 一 个 异步 协议 ， 不 保证 消息 到 达 的 次 序 ， 内 容 是 否 
正确 ， 其 至 不 保证 消息 是 否 到 达 。 与 TCP 这 样 的 协议 相 比 ， 在 交换 机 中 ，UDP 通常 有 较 
低 的 包 延 迟 时 间 ， 因 为 不 需要 执行 错误 检查 和 恢复 。 


在 决定 使 用 UDP 之 前 ， 要 确保 应 用 设计 能 够 在 包 丢失 或 出 错 的 情况 下 也 能 继续 工作 。 


由 于 UDP 使 用 异步 消息 作为 模型 ， 所 以 很 容易 用 core.async 来 包装 原始 的 DatagramSocket 
实例 。core.async 提供 了 很 好 的 信道 抽象 ， 让 你 能 够 以 清晰 的 、 管 理 良好 的 方式 ， 消 费 和 
产生 本 质 上 异步 的 事件 (如 UDP 消息 )。 






































UDP 组 播 
利用 一 种 名 为 UDP 组 播 的 技术 ，UDP 也 可 以 将 同一 个 数据 包 发 往 多 个 目的 地 。 要 使 用 组 
播 ， 需 要 创建 java.net.MulticastSocket 实例 来 灰 代 java.net.DatagramSocket 实例 。 


Oracle 网 站 上 的 文档 (http://docs.oracle.com/javase/7/docs/api/java/net/MulticastSocket.htm!l) 
很 好 地 解释 了 如 何 使 用 MutLttcastSsocket， 此 处 不 再 歼 述 ， 因 为 就 是 直接 利用 Java 的 互 操 
作 性 。 看 过 前 面 的 例子 ， 扩 展 到 MulticastSocket 应 该 不 言 自 明 。 























参阅 

。 3.11 节 “ 用 core.async 解除 消费 者 和 生产 者 的 耦合 ”。 

。 5.9 节 “ 创 建 TCP 客户 端 ”。 

。 5.10 节 “ 创 建 TCP 服务 器 ”。 

。 java.net.MulticastSocket 的 API 文 档 (http://docs.oracle.com/javase/7/docs/api/java/net/ 
MulticastSocket.html ) 。 
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第 6 章 


数据 库 





6.0 简介 


在 当今 时 代 ， 将 数据 存储 在 数据 库 中 是 开发 者 经 常 遇 到 的 任务 ， 这 是 理所当然 的 事情 。 
和 世界 上 大 多 数 的 编程 语言 一 样 ，Clojure 也 有 一 群 驱 动 和 客户 端 ， 与 数据 库 交 互 。 但 
Clojure 的 不 同 之 处 在 于 ， 它 能 够 组 合 。 





2 





本 书 在 前 面 曾 提 到 : 在 Clojure 中 ， 数 据 为 王 。 你 会 发 现 许 多 数据 库 客户 端 库 ， 它 们 干 一 
点 点 跑腿 的 活 ， 然 后 马上 为 你 让 开道 路 。 这 些 库 这 样 做 不 是 因为 懒 (至 少 我 们 希望 如 此 )， 
而 是 出 于 关注 点 分 离 的 原则 : 我 来 处 理 数据 库 连 接 ， 你 来 处 理 领 域 知识 (数据 ) 。 实 际 上 ， 
最 好 的 API 是 基于 数据 库 ， 只 提供 一 两 个 函数 ， 让 你 操作 数据 和 查询 ， 这 些 数 据 直接 以 
Clojure 数据 结构 的 方式 插入 。 


在 本 章 中 ， 我 们 将 探讨 许多 数据 库 和 技术 ， 包 括 SQL、 全 文本 查找 、Mongo、Redis 和 


Datomic 。 

















Datomic (http://www.datomic.com/) 是 数据 库 领 域 中 比较 有 趣 的 新 进展 。 它 由 Rich Hickey 
(你 可 能 知道 ， 就 是 此 人 写 出 了 Clojure) 发 明和 维护 ， 是 可 伸缩 的 、 支 持 事务 的 、 面 向 值 
的 、 考 虑 时 间 的 数据 库 ， 其 遵循 的 原则 和 原理 与 Clojure 相同 。 如 果 你 喜欢 Clojure， 就 肯 
定 应 该 试 试 Datomic， 它 既 可 以 作为 应 用 的 数据 存储 库 ， 也 可 以 作为 学 习 工 具 ， 进 一 步 控 
索 函 数 式 、 面 向 数据 的 编程 。 
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6.1 连接 SQL 数据 库 


作者 : Tom Hicks， 最 初 由 Simone Mosciatti 提交 


程序 需要 连接 SQL 数据 库 。 


解决 方案 


用 clojure.java.jdbc 库 ， 通 过 JDBC 的 方式 访问 SQL 数据 库 。 





要 继续 这 个 实例 ， 就 需要 连接 一 个 运行 的 SQL 数据 库 和 表 。 我 们 建议 用 PostgreSQL 。 





的 数据 库 : 
# 在 Mac 中 : 


在 PostgreSQL 运行 后 (假定 运行 在 localhost:5432)， 执 行 下 面 的 命令 ,创建 这 个 实例 需要 


$ /Applications/Postgres93.app/Contents/MacOS/bin/createdb cookbook_experiments 














# 在 其 他 环境 中 : 


“9 createdb cookbook_experiments 











在 开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [org.clojure/java.jdbc "0.3.0"]。 你 也 需要 选 定 


的 RDBMS 的 JDBC 驱动 。 如 果 要 继续 这 个 实例 ， 就 用 [org.postgresqL/postgresqL "9.2- 


1003- jdbc4"]。 要 用 lein-try 开始 REPL， 可 输入 下 耳 


$ lein try org.clojure/java.jdbc "0.3.0" \ 
java-jdbc/dsl "0.1.0" \ 











| 的 Leiningen 





org.postgresql/postgresql "9.2-1003-jdbc4" 


命令 : 


要 用 clojure.java.jdbc 与 数据 库 交 互 ， 只 需要 一 个 连接 规格 说 明 。 这 个 规格 说 明 采 用 普 
通 的 Clojure 映射 表 的 形式 ， 其 中 的 值 表明 了 数据 库 驱 动 类 型 、 位 置 和 认证 信息 : 


(def db-spec {:classname "org.postgresql.Driver" 





:subprotocol "postgresql" 


:subname "//Tlocalhost:5432/cookbook_experiments" 





;; 对 不 保密 的 本 地 数据 库 不 需要 


;; :User "bilbo" 
;; :password "secret" 


}) 


调用 clojure.java.jdbc/create-table 函数 ， 带 上 规格 说 明和 不 定数 目的 列 规格 说 明 ， 就 


能 在 指定 的 数据 库 中 创建 一 个 关系 表 : 











wiki.postgresql.org/wiki/Detailed_installation_guides) 找到 相应 操作 系统 的 安装 指南 。 


注 1: Mac 用 户 :访问 http://postgresapp.com/, 下 载 易 于 安装 的 DMG。 其 他 人 :可 以 在 PostgreSQL wiki(https:// 
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(require '[clojure. java. jdbc :as jdbc] 
'[java-jdbc.ddl :as ddl]) 


(jdbc/db-do-commands db-spec false 
(ddl/create-table 
:tags 
[:id :serial "PRIMARY KEY"] 
[:name :varchar "NOT NULL"])) 
;; -> (0) 


许多 其 他 函数 查询 和 操作 数据 库 ， 如 clojure.java.jdbc/insert!， 它 们 以 数据 库 规格 说 明 
作为 第 一 个 参数 : 


(require '[java-jdbc.sql :as sql]) 


(jdbc/insert! db-spec :tags 
{:name "Clojure"} 
{:name "Java"}) 
;; -> ({:name "Clojure", :id 1} {:name "Java", :id 2}) 


(jdbc/query db-spec (sql/select * :tags (sql/where {:name "Clojure"}))) 
;; -> ({:name "Clojure", :id 1}) 


讨论 

clojure.java.jdbc 库 提 供 了 一 些 国 数 ， 包 装 了 Java JDBC 规范 的 基本 功能 。 此 外 ， 来 自 
java-jdbc/dsl 项 目的 java-jdbc.sql 和 java-jdbc.ddl 命名 空间 ， 实 现 了 小 型 的 DSL， 能 
生成 基本 的 SQL DML 和 DDL 语句 。 








因为 clojure.java.jdbc 库 基 于 Java JDBC， 所 以 它 可 以 用 于 许多 最 流行 的 SQL 数据 库 ， 
包括 Apache Derby、HSQLDB、Microsoft SQL Server、MySQL、PostgreSQL 和 SQLite。 





建立 和 访问 数据 源 所 需 的 参数 被 称 为 数据 库 规 格 说 明 (常常 简写 为 db-spec) ， 在 一 个 简单 
的 Clojure 映射 表 中 提供 。 这 个 规格 说 明 中 的 参数 通常 包括 驱动 程序 类 名 、 特 定 RDBMS 
类 型 的 子 协议 、 主 机 名 、 端 口号、 数据 库 名 ， 以 及 用 户 名 和 口令 。 


clojure.java.jdbc 库 也 允许 其 他 儿 种 数据 源 规 格 说 明 ， 包 括 Java URI、 已 经 打开 的 连接 ， 
JNDI 连接 和 普通 字符 串 。 例 如 ， 可 以 用 :connection-uri 键 提供 完整 的 URI 字符 串 : 








;; 作为 规格 说 明 字 符 串 
(def db-spec 
"jdbc:postgresql://bilbo:secret@localhost:5432/cookbook_experiment") 





;; 作为 连接 URI 映射 表 …… 
;; 包括 用 户 名 和 口令 ……: 
(def db-spec 
{:connection-uri (str "jdbc:postgresql://localhost:5432/cookbook_experiments?" 
"user=bilbo&password=secret")}) 




















;; 或 者 不 包括 
(def db-spec 
{:connection-uri "jdbc:postgresql://localhost:5432/cookbook_experiments"}) 


数据 库 记 录 表 示 为 Clojure 映射 表 ， 表 的 列 名 作为 键 。 取 出 一 组 数据 库 记 录 就 得 到 一 个 映 
射 表 序列 ， 然 后 可 以 用 所 有 普通 的 Clojure 函数 处 理 : 








(jdbc/query db-spec (sql/select * :tags)) 
;; -> ({:name "Clojure", :id 1} 
{:name "Java", :id 2}) 


(filter #(not (.endsWith (:name %) "ure")) 
(jdbc/query db-spec (sql/select * :tags))) 
;; -> ({:name "Java", :id 2}) 














还 有 其 他 一 些 Clojure 库 可 以 访问 关系 数据 库 ， 每 个 都 提供 了 不 同 的 抽象 和 DSL， 用 于 操 
作 SQL 数据 和 表达 式 ， 比 如 Korma。 但 是 ，clojure.java.jdbc 包含 了 日 常数 据 库 访问 的 
大 部 分 需求 。 


参阅 

。 6.2 市 “利用 连接 池 连 接 SQL 数据 库 ”， 学 习 利用 BoneCP 和 clojure.java.jdbc 实现 
SQL 数据 库 连接 池 。 

。 6.3 节 “ 操 作 SQL 数据 库 ”， 学 习 利用 clojure.java.jdbc 与 SQL 数据 库 交 互 。 

。 访问 clojure.java.jdbc 的 GitHub 代码 库 (https://github.com/clojure/java.jdbc)， 了 解 该 

库 的 更 多 信息 。 

。 访问 java-jdbc/dst 的 GitHub 代码 库 (https://github.com/seancorfield/jsql)， 了 解 关 于 
它 的 SQL 查询 生成 功能 。 或 者 ， 研 究 Honey SQL (https://github.com/jkk/honeysql)、 
SQLingvo (https://github.com/r0man/sqlingvo)， 或 Korma 库 (http://sqlkorma.com/)， 了 
解 SQL 查询 生成 。Korma 将 在 6.4 市 中 讨论 。 


6.2 利用 连接 池 连 接 SQL 数 据 库 


作者 : Tom Hicks 和 Filippo Diotalevi 




















问题 

希望 利用 连接 池 高 效 地 连接 SQL 数据 库 。 
解决 方案 

使 用 BoneCP 连接 和 语句 池 库 来 包装 基于 JDBC 的 驱动 ， 创 建 数据 资源 池 。 然 后 ， 池 中 的 
数据 资源 被 cLojure.java.jdbc 库 使 用 ， 正 如 6.1 节 “ 连 接 SQL 数据 库 ” 中 描述 的 一 样 。 
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要 继续 这 个 实例 ， 就 需要 连接 一 个 运行 的 SQL 数据 库 和 表 。 我 们 建议 用 PostgreSQL 。 




















在 PostgreSQL 运行 后 (假定 运行 在 localhost:5432) ， 执 行 下 面 的 命令 ， 创 建 这 个 实例 需要 
的 数据 库 : 


# 在 Mac 中 : 
$ /Applications/Postgres93.app/Contents/MacOS/bin/createdb cookbook_experiments 








# 在 其 他 环境 中 : 


$ createdb cookbook_experiments 





人 
还 需要 加 入 适合 RDBMS 的 JDBC 库 。 你 还 需要 SLF4J 日 志 库 。 或 者 ， 可 以 用 Lein-try 开 
始 REPL: 











$ lein try com.jolbox/bonecp "0.8.0.RELEASE" \ 
org.clojure/java.jdbc "0.3.0" \ 
java-jdbc/dsl "0.1.0" \ 
org.postgresql/postgresql "9.2-1003-jdbc4" \ 
org.slf4j/slf4j-nop # Just do not log anything 


首先 ， 创 建 一 个 数据 库 规格 说 明 ， 其 中 包含 访问 数据 库 的 参数 。 它 包含 的 键 说 明了 池 的 最 
初 规模 和 最 大 规模 ， 以 及 分 区 数 。 


(def db-spec {:classname "org.postgresql.Driver" 
:subprotocol "postgresql" 
:subname "//localhost:5432/cookbook_experiments" 
:init-pool-size 4 
:max-pool-size 20 
:partitions 2}) 





要 创建 放 入 池 中 的 BoneCPDataSource 对 象 ， 就 要 定义 一 个 函数 (为 了 方便 ) 来 利用 数据 库 
规格 映射 表 中 的 参数 : 





(import 'com.jolbox.bonecp.BoneCPDataSource) 


(defn pooled-datasource [db-spec] 
(let [{:keys [classname subprotocol subname User password 
init-pool-size max-pool-size idle-time partitions]} db-spec 
min-connections (inc (int (/ init-pool-size partitions))) 
max-connections (inc (int (/ max-pool-size partitions))) 
cpds (doto (BoneCPDataSource.) 
(.setDriverClass classname) 
(.setJdbcUrL (str "jdbc:" subprotocol ":" subname)) 
(.setUsername User) 
(.setPassword password) 








注 2: Mac 用 户 :访问 http://postgresapp.com/ ,下载 易 于 安装 的 DMG。 其 他 人 :可 以 在 PostgreSQL wiki(https:// 
wiki.postgresql.org/wiki/Detailed_installation_guides) 找到 相应 操作 系统 的 安装 指南 。 





.SetMinConnectionsPerpartition min-connections) 
.SetMaxConnectionsPerPpartition max-connections) 
.setPpartitionCount partitions) 
.setStatisticsEnabled true) 
.SetIdleMaxAgeInMinutes (or idle-time 60)))] 
{:datasource cpds})) 


一 一 一 一 一 


利用 这 个 方便 的 函数 来 定义 一 个 放 入 池 中 的 数据 源 ， 连 接 到 数据 库 : 
(def pooled-db-spec (pooled-datasource db-spec)) 


pooled-db-spec 
;; -> {:datasource #<BoneCPDataSource ...>} 


将 这 个 数据 库 规格 作为 所 有 clojure.java.jdbc 函数 的 第 一 个 参数 ， 来 查询 或 操作 数据 库 : 





(require '[clojure.java.jdbc :as jdbc] 
'[java-jdbc.ddl :as ddl] 
'[java-jdbc.sql :as sql]) 


(jdbc/db-do-commands pooled-db-spec false 
(ddl/create-table 
:blog_posts 
[:id :serial "PRIMARY KEY"] 
[:title "varchar(255)" "NOT NULL"] 
[:body :text])) 
;; -> (0) 


(jdbc/insert! pooled-db-spec 

:blog_posts 

{:title "My first post!" :body "This is going to be good!"}) 
;; -> ({:body "This is going to be good!", :title "My first post!", :id 1}) 


(jdbc/query pooled-db-spec 


(sql/select * :blog posts (sql/where{:title "My first post!"}))) 
;; -> ({:body "This is going to be good!", :title "My first post!", :id 1}) 


讨论 


正如 解决 方案 中 展示 的 ，clojure.java.jdbc 库 可 以 利用 JDBC 数据 源 创建 数据 库 连接 ， 这 








样 BoneCP 或 其 他 连接 池 库 就 很 容易 将 连接 放 入 池 中 。 


BoneCP 库 包 装 了 原 有 的 JDBC 类 ， 人 允许 创建 高 效 的 数据 源 。 它 可 以 适 配 传统 的 无 池 本 
和 数据 源 ， 将 它们 扩展 为 Connection 和 PreparedStatement 实例 池 。 




















区 





动 


虽然 该 库 提供 了 儿 种 创建 数据 源 的 方式 ,但 大 多 数 用 户 会 发 现 这 里 提供 的 例子 是 最 容 


易 的 。 


BoneCP 提供 了 几 十 个 配置 参数 ， 控 制 对 数据 源 及 其 连接 的 操作 。 幸 运 的 是 ， 大 多 数 配置 
参数 都 有 默认 值 。 可 以 通过 参数 指定 来 控制 各 个 方面 ， 如 连接 池 的 最 小 规模 、 最 大 规模 和 
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初始 规模 、 空 闲 连接 数 、 连 接 的 时 间 、 事 务 处 理 、PreparedStatement 池 的 使 用 ， 以 及 是 
否 、 何 时 和 如 何 测 试 池 中 的 连接 。 


通过 调用 库 中 BoneCPDataSource 类 的 close 方法 ， 可 以 释放 池 中 的 数据 资源 (线程 和 数据 
库 连接 )。 关 闭 后 再 试图 使 用 池 中 的 数据 产 ， 将 导致 SQL 异常 : 











(.close (:datasource pooled-db-spec)) 
;; -> nil 


6.1 节 “ 连 接 SQL 数据 库 ”， 了 解 用 clojure.java.jdbc 实现 大 本 数据 库 连接 。 

6.3 节 “ 操 作 SQL 数据 库 ”， 学 习 利 用 clojure.java.jdbc 与 SQL 数据 库 交 互 。 

BoneCP 的 文 档 (http://jolbox.com/index.html?page=http://jolbox.com/configuration.html) 
和 GitHub 代码 库 (https://github.com/wwadge/bonecp)。 

。 clojure.java.jdbc 的 GitHub 代码 库 (https://github.com/clojure/java.jdbc)， 了 解 该 库 的 
更 多 信息 。 


6.3 操作 SQL 数据 库 


作者 : Tom Hicks 














问题 

Clojure 程序 需要 操作 SQL 数据 库 中 的 表 和 记录 。 
解决 方案 

用 clojure.java.jdbc 库 ， 基 于 JDBC 来 访问 SQL 数据 库 
要 继续 这 个 实例 ， 就 需要 连接 一 个 运行 的 SQL 数据 库 和 表 。 我 们 建议 用 PostgreSQL 。 

















o 














在 PostgreSQL 运行 后 (假定 运行 在 localhost:5432)， 执 行 下 面 的 命令 ， 创 建 这 个 实例 需要 
的 数据 库 : 


# 在 Mac 中 : 


$ /Applications/Postgres93.app/Contents/MacOS/bin/createdb cookbook_ experiments 

















# 在 其 他 环境 中 : 


$ createdb cookbook_experiments 











注 3: Mac 用 户 :访问 http:/postgresapp.com/, 下 载 易于 安装 的 DMG。 其 他 人 :可 以 在 PostgreSQL wiki(https:/ 
wiki.postgresql.org/wiki/Detailed_installation_guides) 找到 相应 操作 系统 的 安装 指南 。 





在 开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [org.clojure/java.jdbc "0.3.0"] 和 [java- 
jdbc/ds1"0.1.0"]。 还 需 选 定 RDBMS 的 JDBC 驱动 。 如 果 要 继续 这 个 实例 ， 请 用 [org. 
postgresql/post gresql "9.2-1003-jdbc4"]。 要 用 1Lein-try 开始 REPL， 请 输入 以 下 


Leiningen 命令 : 








$ lein try org.clojure/java.jdbc "0.3.0" \ 
java-jdbc/dsl "0.1.0" \ 
org.postgresql/postgresql "9.2-1003-jdbc4" 





然后 定义 如 何 访 问 该 数据 库 : 


(def db-spec {:classname "org.postgresql.Driver" 
:subprotocol "postgresql" 
:subname "//Tlocalhost:5432/cookbook_experiments"}) 





要 创建 新 表 ， 请 用 java-jdbc.ddl/create-table 国 数 来 生成 必要 的 DDL 语句 ， 然 后 将 该 语 
名 传递 给 jdbc/db-do-commands 国 数 执行 ; 


(require '[clojure.java.jdbc :as jdbc] 
'[java-jdbc.ddl :as ddL]) 


(jdbc/db-do-commands db-spec 
(ddl/create-table :fruit 

[:name "varchar(16)" "PRIMARY KEY"] 

[:appearance "varchar(32)"] 

[:cost :int "NOT NULL"] 

[:unit "varchar(16)"] 

[:grade :real])) 

> (0) 


9 9 














利用 clojure.java.jdbc/insert! 函数 ， 向 表 中 插入 完整 的 记录 。 调 用 它 时 ， 每 行 表示 为 一 
个 向 量 ， 其 中 包含 各 列 的 值 。 要 确保 提供 的 列 值 与 表 中 声明 的 列 顺序 一 致 : 




















(jdbc/insert! db-spec :fruit 
nil ; 列 名 省 略 了 
["Red Delicious" "dark red" 20 "bushel" 8.2] 
["Plantain" "mild spotting" 48 "stalk" 7.4] 
["Kiwifruit" "fresh" 35 "crate" 9.1] 
["Plum" "ripe" 12 "carton" 8.4]) 

;; -> (111 1) 

















要 查询 数据 库 ， 就 用 java-jdbc.sql/select 国 数 生 成 查询 的 SQL， 然 后 调用 clojure. 
java.jdbc/query 来 执行 : 

(require '[java-jdbc.sql :as sqL]) 

(jdbc/query db-spec 


(sql/select * :fruit (sql/where {:appearance "ripe"}))) 
;; -> ({:grade 8.4, :unit "carton", :cost 12, :appearance "ripe", :name "Plum"}) 





数据 库 | 237 





如 果 不 再 需要 某 个 表 ， 就 用 java-jdbc.ddl/drop-table 生成 相应 的 DDL 语句， 再 调用 
clojure.java.dbc/jdb-do-commands 来 执行 : 
(jdbc/db-do-commands db-spec 


(ddl/create-table :delete me 
[:name "varchar(16)" "PRIMARY KEY"])) 


(jdbc/db-do-commands db-spec (ddl/drop-table :delete me)) 
;; -> (0) 


讨论 

clojure.java.jdbc 库 提 供 了 一 些 函 数 ， 包 装 了 Java JDBC 规范 的 基本 功能 。java- jdbc/ 
dsl 项 目的 java-jdbc.sql 和 java-jdbc.ddl 命名 空间 ， 实 现 了 小 型 的 DSL， 能 生成 基本 的 
SQL DML 和 DDL 语句 。 


java-jdbc/dsl 曾经 是 clojure.java.jdbc 的 一 部 分 ， 但 后 来 被 移 除 ， 目 的 
是 让 核心 库 的 API 尽 可 能 小 。 





java-dbc.ddl/create-table 国 数 生 成 了 创建 表 所 需 的 DDL。 参 数 是 一 个 表 名 和 一 个 向 量 ， 
向 量 中 包含 每 列 的 规格 说 明 。 在 本 书 编写 时 ， 表 级 的 规格 说 明 还 不 支持 。 








插入 和 更 新 记录 
记录 可 以 用 多 种 方式 插入 表 中 。 除 了 前 面 提 到 的 向 量 方式 ，clojure.java.jdbc/insert! 国 
数 还 可 以 接受 一 个 或 多 个 映射 表 ， 其 中 以 列 名 作为 键 : 








(jdbc/insert! db-spec :fruit 
{:name "Banana" :appearance "spotting" :cost 35} 
{:name "Tomato" :appearance "rotten" :cost 10 :grade 1.4} 
{:name "Peach" :appearance "fresh" :cost 37 :unit "pallet"}) 
;; -> ({:grade nil, :unit nil, :cost 35, :appearance "spotting", :name "Banana"} 


2 {:grade 1.4, :unit nil, :cost 10, :appearance "rotten", :name "Tomato"} 
pe {:grade nil, :unit "pallet", :cost 37, :appearance "fresh", 
i :name "Peach"}) 


如 果 插 入 一 行 而 不 指定 某 些 列 的 值 ， 可 以 在 调用 clojure.java.jdbc/insert! 时 以 包含 列 名 
的 向 量 作 为 第 一 个 参数 ， 后 面 是 一 个 或 多 个 向 量 ， 包 含 对 应 列 的 值 : 














(jdbc/insert! db-spec :fruit 
[:name :cost] 
["Mango" 84] 
["Kumquat" 77]) 

;; -> (1 1) 





要 更 新 已 有 的 记录 ， 就 调用 clojure.java.jdbc/update!， 参 数 是 一 个 映射 表 ， 包 含 列 名 和 
对 应 的 新 值 。 可 选 的 java-jdbc.sqL/where 子 句 控制 需要 更 新 哪些 行 : 

















(jdbc/update! db-spec :fruit 
{:grade 7.0 :appearance "spotting" :cost 75} 
(sql/where {:name "Mango"})) 

;; -> (1) 


事务 

提供 数据 库 事务 是 为 了 确保 多 个 操作 以 原子 方式 执行 〈 即 都 执行 或 都 不 执行 )。ctLojure. 
java.jdbc/with-db-transaction 宏利 用 数据 库 规格 说 明 ， 创 建 了 感知 事务 的 连接 。 使 用 这 
个 感知 事务 的 连接 来 实现 事务 : 








;; 原子 地 插入 两 种 新 水 果 
(jdbc/with-db-transaction [trans-conn db-spec] 
(jdbc/insert! trans-conn :fruit {:name "Fig" :cost 12}) 
(jdbc/insert! trans-conn :fruit {:name "Date" :cost 14})) 
;; -> ({:grade nil, :unit nil, :cost 14, :appearance nil, :name "Date"}) 





如 果 抛 出 异常 ， 
;; 查询 表 中 现在 有 多 少 记录 


(defn fruit-count 
"Query how many items are in the fruit table." 
[db-spec] 
(let [result (jdbc/query db-spec (sql/select "count(*)" :fruit))] 
(:count (first result)))) 


jn 


lk 务 将 回 深 : 








(fruit-count db-spec) 
;; -> 11 


(jdbc/with-db-transaction [trans-conn db-spec] 
(jdbc/insert! trans-conn :fruit 
[:name :cost] 
["Grape"” 86] 
["Pear" 86]) 
;; 这 时 insert! 调用 已 经 完成 ， 但 事务 还 没完 成 
;; 异常 将 导致 事务 回 深 ， 所 以 数据 库 没有 变化 
(throw (Exception. "sql-test-exception"))) 
;; -> Exception sql-test-exception ... 


;; 表 的 记录 数 仍然 一 样 
(fruit-count db-spec) 
;; -> 11 









































事务 可 以 通过 clojure.java.jdbc/db-set-rollback-only! 商 数 显 式 地 设置 为 回 深 。 这 种 设 
置 可 以 通过 clojure.java.jdbc/db-unset-rollback-only! 国 数 取消 ， 通 过 clojure.java. 
jdbc/is-rollback-only 函数 来 测试 .; 
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(fruit-count db-spec) 
;; -> 11 


(jdbc/with-db-transaction [trans-conn db-spec] 
(jdbc/db-set-rollback-only! trans-conn) 
(jdbc/insert! trans-conn :fruit {:name "Pear" :cost 69})) 

;; -> ({:grade nil, :unit nil, :cost 69, :appearance nil, :name "Pear"}) 


;; 表 的 记录 数 仍然 一 样 
(fruit-count db-spec) 
;; -> 11 


读 取 和 处 理 记录 
查询 返回 的 数据 库 记 录 是 Clojure 映射 表 ， 表 的 列 名 用 作 映 射 表 中 的 键 。 取 回 一 组 数据 库 


记录 就 得 到 一 系列 的 映射 表 ， 能 由 所 有 的 普通 Clojure 函数 处 理 。 下 面 ， 我 们 查询 fruit 表 
中 的 全 部 记录 ， 收 集 所 有 低 品 质 水 果 的 名 称 和 等 级 : 

















(->> (jdbc/query db-spec (sql/select "name, grade" :fruit)) 
;; 过 滤 所 有 水 果 ， 找 出 grade < 3.0 的 
(filter (fn [{:keys [grade]}] (and grade (< grade 3.0)))) 
(map (juxt :name :grade))) 

;; -> (["Tomato" 1.4]) 








前 面 例子 中 使 用 了 java-jdbc.sql 命名 空间 提供 的 SQL DSL。 这 个 DSL 实现 是 SQL 语 
句 生成 的 简单 抽象 。 目 前 ， 它 提供 了 一 些 基 本 的 机 制 ， 支 持 select、join、where 子 句 和 
order-by 子 句 ; 





| 

















(defn fresh-fruit [] 
(jdbc/query db-spec 
(sql/select [:f.name] {:fruit :f} 
(sql/where {:f.appearance "fresh"}) 
(sql/order-by :f.name)))) 


(fresh-fruit) 
;; -> ({:name "Kiwifruit"} {:name "Peach"}) 


使 用 SQL DSL 完全 是 可 选 的 。 要 更 直接 地 控制 ， 可 以 向 query 函数 传递 一 个 向 量 ， 其 中 包 


含 SQL 查询 字符 串 和 参数 。 下 面 的 函数 也 找 出 了 低 品 质 的 水 果 ， 但 它 直接 将 品质 国 值 传递 
给 了 SQL 语句 : 

















(defn find-low-quality [acceptable] 
(jdbc/query db-spec 
["select name, grade from fruit where grade < ?" acceptable])) 


(find-low-quality 3.0) 
;; -> ({:grade 1.4, :name "Tomato"}) 





jdbc/query 国 数 有 一 些 可 选 的 关键 字 参 数 ， 控 制 它 如 何 构造 返回 的 结果 集 。:resutt-set- 
fn 参数 指定 了 一 个 函数 ， 它 将 作用 于 整个 结果 集 〈 一 个 惰性 序列 ) ， 然 后 再 返回 。 默 认 的 














参数 是 doatt 函数 ， 
(defn hi-lo [rs] [(first rs) (last rs)]) 


;; 找 出 价格 最 高 和 最 低 的 水 果 

(jdbc/query db-spec 
["select * from fruit order by cost desc"] 
:result-set-fn hi-Lo) 


;; -> [{:grade nil, :unit nil, :cost 77，:appearance nil, :name "Kumquat"} 
3 {:grade 1.4, :unit nil, :cost 10, :appearance "rotten", :name "Tomato"}] 





:row-fn 参数 指定 了 一 个 函数 ， 在 结果 集 生成 时 ， 它 将 应 用 于 结果 集中 的 每 一 行 。 默 认 的 
参数 是 identity 函数 : 





(defn add-tax [row] (assoc row :tax (* 0.08 (row :cost)))) 


(jdbc/query db-spec 
["select name,cost from fruit where cost = 12"] 
:row-fn add-tax) 
;; -> ({:tax 0.96, :cost 12, :name "Plum"} {:tax 0.96, :cost 12, :name "Fig"}) 





TI 


Boolean 类 型 的 参数 :as-arrays? 表明 返回 的 结果 集 是 否 作为 一 组 向 量 。 默 认 的 参数 人 


faLse : 














(jdbc/query db-spec 
["select name,cost,grade from fruit where appearance = 'spotting'"] 
:as-arrays? true) 

;; -> ([:name :cost :grade] ["Banana" 35 nil] ["Mango" 75 7.0]) 


最 后 ，:identifiers 参数 指定 了 一 个 函数 ， 它 将 作用 于 结果 集中 的 每 个 列 名 。 默 认 的 参数 
是 clojure.string/Lower-case 国 数 ， 它 取 表 中 列 名 的 小 写 形式 ， 然 后 再 转 为 关键 字 。 如 果 
应 用 需要 对 列 名 进行 某 种 不 同 的 转换 ， 就 通过 这 个 关键 字 参 数 提供 男 一 个 函数 。 


对 于 快速 简便 地 访问 大 多 数 流 行 的 关系 型 数据 库 ，clojure.java.jdbc 库 是 一 个 好 选择 。 
它 使 用 Clojure 的 向 量 和 映射 表 来 表示 记录 ， 这 与 Clojure 强调 面向 数据 的 编程 是 一 致 的 。 
SQL 的 初学 者 可 以 利用 提供 的 DSL， 而 专业 用 户 可 以 直接 构造 并 执行 复杂 的 SQL 语句 。 





















































参阅 

。 6.1 节 “ 连 接 SQL 数据 库 ”， 了 解 用 clojure.java.jdbc 实现 基本 数据 库 连 接 。 

。 6.2 市 “利用 连接 池 连 接 SQL 数据 库 ”， 学 习 利 用 BoneCP 和 clojure.java.jdbc 实现 
SQL 数据 库 连 接 池 。 

。 clojure.java.jdbc 的 GitHub 代码 库 (https://github.com/clojure/java.jdbc)， 了 解 该 库 的 
更 多 信息 。 
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。 访问 java-jdbc/dst 的 GitHub 代码 库 (https://github.com/seancorfield/jsql)， 了 解 关 于 
它 的 SQL 查询 生成 功能 。 或 者 ， 研 究 Honey SQL (https://github.com/jkk/honeysq1)、 
SQLingvo (https://github.com/r0man/sqlingvo)， 或 Korma 库 (http://sqlkorma.com/)， 了 
解 SQL 查询 生成 。Korma 将 在 6.4 市 讨论 。 





6.4 用 Korma 简 化 SQL 


作者 : Dmitri Sotnikov 和 Chris Allen 














希望 处 理 存储 在 关系 数据 库 中 的 数据 ， 又 不 用 手写 SQL。 


解决 方案 


使 用 Korma 作为 DSL 来 生成 SQL 查询 ， 并 遍历 关系 。 





在 开始 之 前 ， 请 在 项 目 依赖 关系 中 加 入 [korma "9.3.0-RC6"] 和 [org.postgresqL/postgr 
esqL "9.2-1002-jdbc4"]， 或 用 lein-try 开始 REPL: 





$ lein try korma org.postgresql/postgresql 





要 继续 这 个 实例 ， 就 需要 连接 一 个 运行 的 SQL 数据 库 和 表 。 我 们 建议 用 PostgreSQL 。 








在 PostgreSQL 运行 后 (假定 运行 在 localhost:5432)， 执 行 下 面 的 命令 ， 创 建 这 个 实例 需要 
的 数据 库 : 


# 在 Mac 中 : 
$ /Applications/Postgres.app/Contents/MacOS/bin/createdb Learn_korma 

















# 在 其 他 环境 中 : 


$ createdb Learn_korma 





要 连接 Learn_korma 数据 库 ， 就 用 defdb 和 postgres 辅助 函数 。 因 为 Korma 是 相当 大 的 
DSL， 所 以 可 以 接受 将 它 的 内 容 :refer :all 到 模型 命名 空间 中 : 








(require '[korma.db :refer :all]) 


(defdb db 
(postgres {:db "learn_korma"})) 





注 4: Mac 用 户 : 访 问 http:/postgresapp.com/, 下 载 易于 安装 的 DMG。 其 他 人 :可 以 在 PostgreSQL wiki(https:// 
wiki.postgresql.org/wiki/Detailed_installation_guides) 找到 相应 操作 系统 的 安装 指南 。 











要 与 数据 库 中 的 表 进 行 交互 ， 先 定义 并 创建 Korma 所 谓 的 实体 。 下 面 将 定义 博客 文章 的 
实体 : 














(defentity posts 
(pk :id) 
(table :posts) ; 表 名 
(entity-fields :title :content)) ; 默认 要 SELECT 的 字段 


一 般 会 利用 合适 的 迁移 库 (migration library) 作为 schema， 但 为 了 简单 ， 我 们 手工 创建 一 
个 表 。 用 exec-raw 函数 对 数据 库 执 行 原始 的 SQL 语句 。 只 有 在 非常 有 必要 时 才 这 样 做 : 











(def create-posts (str "CREATE TABLE posts " 
"(id serial, title text, content text," 
"created_on timestamp default current timestamp);")) 


(exec-raw create-posts) 





既然 posts 表 已 经 存在 ， 就 可 以 对 posts 调用 insert， 并 带 上 值 的 映射 表 作 为 参数 ， 向 数 
据 库 中 添加 记录 。 每 条 记录 都 表示 为 一 个 映射 表 。 映 射 表 中 键 的 名 称 必须 与 数据 库 的 列 名 
匹配 : 

















(insert posts 
(values nil {:title "First post" :content "blah blah blah"})) 


要 从 数据 库 中 取得 值 ， 就 用 select 来 查询 。 成 功 的 查询 将 返回 一 个 映射 表 序 列 ， 每 个 映射 
表 中 包含 的 键 表示 列 名 : 





(select posts (limit 1)) 
;; -> [{:created_on #inst "2013-11-01T19:21:10.652920000-00:00"， 


3 :content "blah blah blah", 
3 :title "First post", 
EE :id 1}] 


要 纠正 或 改变 原 有 的 记录 ， 就 用 update 宏 。 对 posts 调用 update， 提 供 set-fields 声明 
来 指定 应 该 改变 什么 ， 提 供 where 声明 来 缩小 要 改变 的 记录 的 范围 : 
(update posts 
(set-fields {:title "Best Post"}) 


(where {:title "First post"})) 
;; -> {:title "Best Post", :id 1 ...} 


delete 宏 与 update 类 似 ， 但 不 接受 set-fields 声明 : 


(delete posts 
(where {:title "Best Post"})) 


(select posts) 
;; -> [] 
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讨论 
Korma 提供 了 一 种 简单 而 直观 的 方式 ， 从 Clojure 中 构建 SQL 查询 。 使 用 Korma 的 好 处 在 

， 查 询 是 用 正常 的 代码 写成 ， 而 不 是 SQL 字符 串 。 你 可 以 很 容易 地 编写 查询 ， 抽 象 出 公 
共 的 操作 。 


























Korma 通过 它 的 实体 系统 提供 了 这 些 能 力 。 实 体 是 在 传统 SQL 表 之 上 的 抽象 ， 遮 盖 了 
SQL 令 人 不 快 的 复杂 和 麻烦 的 DDL (数据 定义 语言 )。 通 过 defentity 宏 ， 可 以 获得 传统 
SQL 的 所 有 功能 ， 这 些 功能 被 包装 成 可 读 的 、 基 于 Clojure 的 DSL。 


在 用 defentity 定义 实体 时 ， 可 以 传人 一 些 选 项 。 常 用 的 选项 包括 指定 表 名 的 table， 指 
定 默 认 ID 字段 的 pk (主键 )， 指 定 SELECT 语句 默认 字段 的 entity-fieLds， 甚 至 还 有 指 
定 实体 属于 哪个 数据 库 的 db。 

















实体 也 简化 了 表 间 关系 的 定义 。 实 体 声明 语句 ， 如 has-one、has-many、betongs-to 和 
many-to-many 等 ， 定 义 了 它 与 其 他 实体 的 关系 。 请 考虑 为 每 篇 博客 文章 添加 一 个 作者 : 














;; 创建 authors， 假 定 posts 有 author_id 字段 
(defentity authors 
;; 默认 情况 下 ， 外 键 是 :authors_id， 但 这 有 点 别扭 
(has-many posts {:fk :author_id})) 





;; 重新 定义 posts， 它 假定 有 author_id 字段 
(defentity posts 
(belongs-to authors {:fk :author_id})) 





;; 创建 authors 表 
(exec-raw "CREATE TABLE authors (id serial, name text);") 





;; 在 posts 中 添加 authors_id 字段 
(exec-raw "ALTER TABLE posts ADD COLUMN author_id int;") 


(def ryan (insert authors (values {:name "Ryan"}))) 
ryan 
;; -> {:name "Ryan", :id 1} 


(insert posts (values [{:title "My first post!", :author_id (:id ryan)} 
{:title "My second post.",:author_id (:id ryan)}])) 
(select posts 
(where {:author_id (:id ryan)})) 
;; -> [{:author_id 1， 


5 :title "My first post!", 


3 :id 4} 

2 {:author_id 1， 

:title "My second post.", 
2 :id 5}] 





基于 它 的 实体 系统 ，Korma 提供 了 常见 SQL 语句 的 DSL 版本， 如 select、update、 
insert 和 delete。 最 有 趣 的 查询 类 型 是 setect， 它 几乎 支持 SELECT 语句 的 所 有 选项 ， 
包括 简化 的 表 连 接 (通过 它 的 关系 辅助 函数 )。 一 些 值得 注意 的 辅助 函数 包括 aggregate、 
join、order、group 和 having。 很 可 能 SQL 语句 的 每 个 功能 ， 在 Korma 中 都 有 对 应 的 辅 
助 函数 。 


Korma 的 DSL 不 仅 方便 ， 而 且 可 组 合 。 使 用 select* 而 不 是 select， 将 查询 返回 为 一 个 
值 ， 而 不 是 执行 后 的 结果 。 你 可 以 连接 多 个 查询 值 ， 通 过 常规 的 select 辅助 函数 来 建立 或 
保存 部 分 查询 。 最 后 ， 对 查询 值 调用 select， 执 行 它 并 得 到 结果 : 









































(defn authors-posts 
"Retrieve all posts for a person with a given name" 
[name] 
(-> (select* posts) 
(with authors) 
(where {:authors.name name}))) 


;; 找到 作者 名 为 "Ryan" 的 所 有 文章 
(-> (authors-posts "Ryan") 
(where (like :title "%second%")) 
(fields :title) 
select) 
;; -> [{:title "My second post."}] 


Korma 提供 的 另 一 种 方便 是 默认 连接 。 你 可 能 已 经 注意 到 ， 在 例子 中 我 们 从 未 引用 我 们 定 


义 的 db。 如果 只 定义 了 一 个 连接 ， 它 将 作为 默认 值 ， 不 需要 明确 地 传递 。 如 果 乐 意 ， 也 可 
以 定义 多 个 连接 ， 将 一 系列 语句 包装 在 with-db 调用 中 























(with-db db 
(select (authors-posts "Ryan"))) 


参阅 
。 Korma 项 目 官方 页 面 (http://sqlkorma.com/docs)。 


6.5 ”用 Lucene 进 行 全 文 查找 


作者 : Osbert Feng 





问题 
希望 在 无 结构 或 半 结 构 化 的 数据 集中 ， 用 Lucene 实现 灵活 的 全 文 查找 。 例 如 ， 你 想 找到 
在 美国 的 、 所 有 职位 描述 中 包含 “Clojure” 的 人 。 
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解决 方案 
使 用 Clucy (https://github.com/weavejester/clucy)， 它 是 Lucene 的 Clojure 包装 。Clucy 提 
供 了 一 些 工 具 ， 在 Clojure 进程 中 构建 和 查询 索引 。 





要 继续 这 个 实例 ， 需 要 创建 一 个 新 项 目 〈Letn new text-search)， 在 项 目 依赖 关系 中 添 
加 [cLucy "0.4.0"]， 并 用 Lein repl 启动 REPL  。 


下 面 的 代码 创建 并 查询 了 简单 的 内 存 索 引 : 


(require '[clucy.core :as clucy]) 














(def index (clucy/memory-index)) 
;; -> #'User/index 


(clucy/add index 
{:name "Alice" :description "Clojure expert" 
:location "North Carolina, United States"} 
{:name "Bob" :description "Clojure novice" 
:location "Berlin, Germany"} 
{:name "Eve" :description "Eavesdropper" 
:location "Maryland, United States"}) 
;; -> nil 


(clucy/search index "description:clojure AND location:\"united states\"" 10) 
;; -> ({:name "Alice", 


3 :location "North Carolina, United States", 
pn :description "Clojure expert"}) 

Be * 八 

讨论 


Lucene 是 一 个 信息 检索 的 Java 库 。 要 使 用 Lucene， 需 要 生成 文档 并 对 它们 进行 索引 ， 以 
便 将 来 检索 。 文 档 由 字段 和 词语 构成 。 这 个 例子 中 的 文档 相当 小 ， 但 Lucene 也 能 高 效 地 
索引 大 量 的 巨型 文档 。 





Clucy 包装 了 Lucene， 方 便 在 Clojure 中 使 用 ， 并 能 够 直接 从 简单 的 Clojure 映射 表 生 成 
Lucene 文档 。 映 射 表 中 的 键 对 应 于 字段 ， 值 对 应 于 要 索引 的 文本 数据 。 


clucy.core/search 接受 索引 、 查 询 字符 串 和 返回 结果 的 条 数 作为 参数 。Lucene 能 够 高 效 
地 查询 部 分 是 因为 ， 它 不 需要 返回 所 有 匹配 的 文档 ， 只 要 返回 前 n 个 最 佳 匹配 。 











Clucy 不 能 很 好 地 支持 映射 表 中 内 套 的 值 。 要 正确 地 索引 和 检索 ， 请 确保 将 
值 转换 成 简单 的 字符 串 。 








注 5: 我 们 一 般 建 议 使 用 lein-try， 但 这 个 插件 目前 与 Clucy 不 兼容 。 
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这 个 例子 使 用 了 memory-index， 它 将 索引 存在 系统 内 存 中 。 在 多 数 真 正 的 应 用 中 ， 你 会 希 
望 将 索引 持久 在 磁盘 上 ， 这 样 索引 就 能 超出 可 用 内 存 的 大 小 ， 并 且 你 可 以 重新 启动 进程 而 
不 必 重 新 建立 索引 。Clucy 通过 disk-index 函数 支持 创建 Lucene 磁盘 索引 : 

















(def index (clucy.core/disk-index "/tmp/index")) 





作为 文档 生成 过 程 的 一 部 分 ，Lucene 对 字符 串 调 用 一 个 分 析 器 ， 生 成 用 于 索引 的 词语 。 默 
认 的 StandardAnalyzer 适用 于 多 数 情况 ， 并 能 够 定制 一 个 “排除 词 ”(stop word) 列表 ， 在 
词语 生成 时 忽略 : 





(import 'org.apache.lucene.analysis.standard.StandardAnalyzer) 
;; -> org.apache.lucene.analysis.standard.StandardAnalyzer 


(import 'org.apache.lucene.analysis.util.CharArraySet) 
;; -> org.apache.lucene.analysis.util.CharArraySet 


(def stop-words 
(doto (CharArray. clucy.core/*version* 3 true) 
(.add "do") 
(.add "not") 
(.add "index"))) 


(binding [clucy.core/*analyzer* (StandardAnalyzer. 
Clucy.core/*version* 
stop-words)] 

;; 在 这 里 调用 索引 添加 和 查找 ， 在 binding 之 内 
) 





但 在 另 一 些 情况 下 ， 可 能 需要 使 用 不 同 的 分 析 器 ， 或 自己 写 的 分 析 器 。 例 如 ， 
EnglishAnalyzer 利用 了 波 特 词 干 (Porter stemming) 和 其 他 技术 ， 更 适合 考虑 复数 和 所 有 


(import org.apache. lucene.analysis.en.EnglishAnalyzer) 
;; -> org.apache.lucene.analysis.en.EnglishAnalyzer 


(binding [clucy.core/*analyzer* (EnglishAnalyzer. clucy.core/*version*)] 
;; 在 这 里 调用 索引 添加 和 查找 形式 ， 在 binding 之 内 
) 

















基本 的 查询 语法 是 field:term。 上 默认 情况 下 ， 多 个 子 句 表示 OR 查找 ， 所 以 如 果 要 求 子 名 
同时 为 真 ， 就 要 明确 使 用 AND。 





如 果 不 指定 字段 ， 就 会 使 用 隐 含 的 字段 content， 将 对 映射 表 中 所 有 的 值 进行 索引 。 
返回 的 文档 由 Lucene 默认 的 相关 性 算法 来 排序 ， 该 算法 考虑 了 词 频 、 距 离 和 文档 长 度 : 
(clucy.core/search index "clojure united states" 10) 


;; -> ({:name "Alice", 
3 :location "North Carolina, United States", 
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:description "Clojure expert"} 


a {:name "Eve", 
i :location "Maryland, United States", 
2 :description "Eavesdropper"} 
2 {:name "Bob", 
Ss :location "Berlin, Germany", 
3 :description "Clojure novice"}) 
My 
参阅 


。 Lucene 项 目 主 页 (http:Wlucene.apache.org/) 。 
。 Clucy 的 GitHub 代码 库 (https://github.com/weavejester/clucy)。 


6.6 ”用 ElasticSearch 建 立 数据 索引 


作者 : Michael Klishin 








希望 用 ElasticSearch (http://elasticsearch.org/) 索引 和 查找 引擎 ， 来 建立 数据 索引 。 


解决 方案 
使 用 Elastisch (http:/clojureelasticsearch.info/) ， 它 是 ElasticSearch Java API 的 最 小 Clojure 
包装 。 





为 了 成 功 执行 本 节 中 的 实例 ， 你 应 该 在 本 地 系统 中 安装 并 运行 ElasticSearch。ElasticSearch 
网 站 (http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/setup.html) 上 有 详 
细 的 安装 指南 。 


ElasticSearch 支持 多 种 传输 方式 (例如 HITP、 原 生 的 、 基 于 Netty 的 传输 和 Memcached ) 。 
Elastisch 支持 HTTP 和 原生 传输 。 本 节 在 实例 中 使 用 HTTP 传输 客户 端 ， 并 在 讨论 小 节 中 
解释 了 如 何 换 成 原生 传输 。 


要 继续 这 个 实例 ， 请 在 项 目 依赖 关系 中 添加 [clojurewerkz/elastisch "1.2.0"]， 或 用 
Lein-try 启动 REPL : 








$ lein try clojurewerkz/elastisch 


在 用 Elastisch 建立 索引 和 查找 之 前 ， 需 要 告诉 Elastisch 使 用 什么 ElasticSearch 节点 。 要 使 
用 HTTP 传输 ， 就 用 clojurewerkz.elastisch.rest/connect! 国 数 ， 它 的 唯一 参数 是 连接 





(require '[clojurewerkz.elastisch.rest :as esr]) 


(esr/connect! "http://127.0.0.1:9200") 


索引 

在 数据 能 被 查找 之 前 ， 需 要 建立 索引 。 建 立 索 引 的 过 程 是 扫描 文本 ， 建 立 查找 词语 的 列 
表 ， 以 及 名 为 查找 索引 的 数据 结构 。 查 找 索 引 让 ElasticSearch 这 样 的 查找 引擎 能 够 高 效 地 
取得 查询 的 相关 文档 。 











索引 过 程 包括 以 下 几 步 。 





(1) 创建 索引 。 
(2) [ 可 选 ] 定义 映射 (文档 应 该 如 何 被 索引 )。 
(3) 通过 HTTP 或 其 他 API 提交 要 索引 的 文档 。 














要 创建 索引 ， 就 用 clojurewerkz.elastisch.rest.index/create 国 数 ; 


(require '[clojurewerkz.elastisch.rest.index :as esi]) 


(esr/connect! "http://127.0.0.1:9200") 





;; 用 给 定 设置 创建 索引 ,没有 定制 的 映射 类 型 


(esi/create "test1") 


;; 创建 带 有 定制 设置 的 索引 


(esi/create "test2" :settings {"number_of_shards" 1})) 





完整 解释 可 用 的 索引 设置 超出 了 本 实例 的 范围 。 更 多 细节 请 参考 Elastisch 关于 索引 的 文档 


(http:/clojureelasticsearch.info/articles/indexing.html) 。 
创建 映射 


映射 定义 了 文档 中 的 字段 ， 以 及 每 个 字段 有 哪些 索引 特点 。 在 创建 索引 时 ， 用 :mapping 选 
项 指定 映射 类 型 : 











(esr/connect! "http://127.0.0.1:9200") 


;; 映射 类 型 映射 表 结 构 与 ElasticSearch API 参考 中 的 一 样 
(def mapping-types {"person" 
{:properties {:username {:type "string" :store "yes"} 
:first-name {:type "string" :store "yes"} 
:last-name {:type "string"} 
:age {:type "integer"} 
:title {:type "string" 
:analyzer "snowball"} 
:planet {:type "string"} 
:biography {:type "string" 
:analyzer "snowball" 
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:term_vector 
"with_positions_offsets"}}}}) 


(esi/create "test3" :mappings mapping-types))) 
索引 文档 


要 将 文档 添加 到 索引 ， 就 用 clojurewerkz.elastisch.rest.document/create 国 数 。 这 将 使 
文档 ID 自动 生成 : 





(require '[clojurewerkz.elastisch.rest.document :as esd]) 
(esr/connect! "http://127.0.0.1:9200") 


(def mapping-types {"person" 
{:properties {:username {:type "string" :store 
:first-name {:type "string" :store 
:Last-name {:type "string"} 


'yes"} 
'yes"} 


:age {:type "integer"} 

:title {:type "string" :analyzer "snowball"} 
:planet {:type "string"} 

:biography {:type "string" 


:analyzer "snowball" 
:term_vector 
"with_positions_offsets"}}}}) 


(esi/create "test4" :mappings mapping-types) 


(def doc {:username "happyjoe" 
:first-name "Joe" 
:last-name "Smith" 
:age 30 
:title "The Boss" 
:planet "Earth" 
:biography "N/A"}) 


(esd/create "test4" "person" doc) 
;; => {:ok true, :_index people, :_type person, 
人 :_id "2vr8sP-LTRWhSKOxyWOi_Q", :_version 1} 


clojurewerkz.elastisch.rest.document/put 将 文档 添加 到 索引 中 ,但 希望 提供 一 个 文档 
ID。 





(esr/put "test4" "person" "happyjoe" doc) 


当 文档 被 添加 到 ElasticSearch 索引 中 时 ， 它 先 被 分 析 。 
分 析 过 程 包括 以 下 几 个 步 又。 
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。 分 词 (将 字段 的 值 分 解 为 词 ， 妈 token ) 。 
。 过 滤 或 修改 词 。 
。 将 分 词 与 字段 名 组 合 ， 得 到 词语 (term)。 








文档 究竟 如 何 分 析 ， 决 定 了 怎样 的 查询 将 匹配 (找到 ) 它 。ElasticSearch 基于 Apache 
Lucene (http:Wlucene.apache.org/) ， 它 为 开发 者 提供 了 几 种 分 析 器 ， 实 现 他 们 需要 的 某 种 查 
询 品质 或 性 能 。 例 如 ， 不 同 的 语言 需要 不 同 的 分 析 器 : 英文 、 中 文 、 阿 拉 伯 文 和 俄 文 不 能 
用 同样 的 方式 分 析 。 


可 以 跳 过 对 字段 的 分 析 ， 并 指定 字段 的 值 是 否 保存 在 索引 中 。 设 有 保存 的 字段 仍 将 被 查 
找 ， 但 不 会 包含 在 查找 结果 中 。 




















ElasticSearch 允许 用 户 定义 不 同类 型 的 文档 如 何 索 引 、 分 析 和 保存 。 


ElasticSearch 对 多 客户 组 织 管理 的 支持 很 好 。ElasticSearch 集群 实际 上 可 以 有 无 数 种 索引 和 
映射 类 型 。 例 如 ， 在 SaaS (软件 作为 服务 ) 产品 中 ， 你 可 以 让 每 个 账户 或 组 织 机 构 使 用 一 
个 独立 的 索引 。 


用 ElasticSearch 来 索引 文档 有 两 种 方式 : 提交 要 索引 的 文档 时 可 以 没有 ID， 或 者 提供 ID 
来 更 新 文档 ， 在 这 种 情况 下 ， 如 果 文 档 已 存在 ， 它 将 被 更 新 (会 创建 一 个 新 版 本 )。 


虽然 在 开发 的 早期 使 用 自动 创建 的 索引 很 好 也 很 常见 ， 但 手工 创建 索引 让 你 能 够 完成 很 多 
配置 ， 指 定 ElasticSearch 如 何 索 引 数 据 ， 从 而 确定 可 以 对 数据 执行 哪些 查询 。 数 据 如 何 索 
引 主 要 由 映射 表 控 制 。 它 们 定义 了 文档 中 的 哪些 字段 需要 索引 ， 是 否 需 要 分 析 和 如 何 分 
析 ， 是 否 被 保存 。ElasticSearch 中 的 每 个 索引 都 有 一 个 或 多 个 映射 类 型 。 映 射 类 型 可 以 看 
成 是 数据 库 中 的 表 (尽管 这 种 类 比 并 非 总 是 正确 )。 在 ElasticSearch 中 ,映射 类 型 是 索引 
的 核心 ， 提 供 了 对 许多 ElasticSearch 功能 的 访问 。 









































例如 ， 博 客 应 用 程序 可 能 有 article、comment 和 person 这 样 的 类 型 。 每 个 类 型 有 不 同 的 映 
射 设置 ， 定 义 了 属于 该 类 型 的 一 组 字段 文档 ， 它 们 应 该 如 何 索引 (从 而 确定 对 它们 可 以 进 
行 怎样 的 查询 ) ， 每 个 字段 的 语言 是 什么 ， 等 等 。 在 应 用 程序 中 正确 设置 映射 类 型 ， 是 好 
的 查找 体验 的 关键 。 











映射 类 型 定义 了 文档 字段 和 它们 的 核心 类 型 (例如 字符 串 、 整 数 或 日 期 /时 间 )。 设 置 以 
JSON 文档 的 形式 提供 给 ElasticSearch，ElasticSearch 网 站 (http://www.elasticsearch.org/ 
guide/reference/mapping/) 提供 了 设置 的 文档 。 


利用 Elastisch， 映 射 设 置 被 指定 为 结构 相同 (schema) 的 Clojure 映射 表 。 下 面 是 一 个 小 
例子 : 


2 





{"tweet" {:properties f{:username  {:type "string" :index "not_analyzed"}}}} 
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关于 映射 设置 可 以 定义 哪些 东西 ， 下 面 是 一 个 简短 的 、 很 不 完整 的 列表 。 


。 文档 字段 及 其 类 型 ， 它 们 是 否 需要 分 析 。 

。 文档 的 生存 时 间 (TTL)。 

。 文档 类 型 是 否 被 索引 。 

。 特殊 字段 ("_all"， 默 认 字段 等 )。 

。 文档 层面 的 增强 (http://www.elasticsearch.org/guide/reference/mapping/boost-field.html)。 














。 时 间 惟 字段 (http:/www.elasticsearch.org/guide/reference/mapping/timestamp-field.html)。 


如 果 用 clojurewerkz.elastisch.rest.index/create 国 数 创建 索引 ， 映 射 设 置 就 通过 :mappings 
选项 传 信 ， 像 前 面 看 到 的 那样 。 如 果 需 要 更 新 索引 的 映射 ， 可 以 用 clojurewerkz.elastisch. 
rest.index/update-mapping 国 数 ; 
































(esi/update-mapping "myapp_deveLopment 
:mapping {:properties 
{:first-name {:type "string" :store "no"}}}) 


person" 














在 映射 配置 中 ,设置 被 作为 映射 表 传 入 ， 其 中 键 是 名 称 (字符 串 或 关键 字 )， 值 是 实际 设 
置 的 映射 表 。 在 下 面 的 例子 中 ， 唯 一 的 设置 是 :properties， 它 定义 了 一 个 字段 = 
不 需要 分 析 的 字符 串 : 


{"tweet" {:properties {:username  {:type "string" :index "not_analyzed"}}}} 
































关于 索引 和 映射 选项 还 有 很 多 内 容 ， 但 超出 了 本 实例 的 范围 。 详 尽 的 功能 清单 请 参考 
Elastisch 的 索引 文档 (http://clojureelasticsearch.info/articles/indexing.html) 。 














参阅 
。 官方 ElasticSearch 指南 (http:/www.elasticsearch.org/guide/) 。 
。 Elastisch 的 主页 (http://clojureelasticsearch.info/)。 


6.7 使 用 Cassandra 


作者 : Alex Petrov 





问题 

希望 使 用 Cassandra 中 存储 的 数据 。 

解决 方案 

用 Cassaforte 库 (http://clojurecassandra.info/) 来 连接 Cassandra 集群 ， 处 理 数 据 库 中 的 
记录 。 














为 了 成 功 执行 本 节 中 的 实例 ， 你 应 该 安装 Cassandra。 可 以 在 GettingStarted 维基 


(http://wiki.apache.org/cassandra/GettingStarted) 找到 安装 Cassandra 的 详细 说 明 。 


页 面 


要 继续 这 个 实例 ， 就 在 项 目 依 赖 关 系 中 添加 [cLojurewerkz/cassaforte "1.1.0"]， 或 用 


lein-try 启动 REPL : 


$ lein try clojurewerkz/cassaforte 





为 了 连接 Cassandra 集群 ， 创 建 并 使 用 你 的 第 一 个 键 空间 ， 就 需要 clojurewerkz.cassaforte. 








client、clojurewerkz.cassaforte.cql 和 clojurewerkz.cassaforte.query 命名 空间 。 


clojurewerkz.cassaforte.client 负责 连接 ， 另 两 个 提供 简单 的 接口 来 执行 查询 





(require '[clojurewerkz.cassaforte.client :as client] 
'[clojurewerkz.cassaforte.cql :as cqL] 
'[clojurewerkz.cassaforte.query :as q]) 


;; 连接 集群 中 的 2 个 节点 


(client/connect! ["localhost" "another .node.LocaL'" ]) 














;; 创建 名 为 “cassaforte_keyspace ` 的 键 空间 ， 使 用 
;; 简单 复制 策略 ， 复 制 系数 为 2 
(cql/create-keyspace "cassaforte keyspace" 
(q/with {:replication 
{:class "SimpleStrategy" 
:replication factor 2 }})) 








;; 切换 到 该 键 空间 


(cql/use-keyspace "cassaforte keyspace") 








现在 可 以 创建 表 并 插入 数据 ， 即 调用 clojurewerkz.cassaforte.cql 命 名 空 


table 和 insert 国 数 : 


(cql/create-table "users" 
(q/column-definitions {:name :varchar 
:city :varchar 
:age :int 
:primary-key [:name]})) 


接 下 来 ， 在 表 中 插入 一 些 用 户 : 


(cql/insert "users" {:name "ALex" :city "Munich" :age (int 26)}) 
(cql/insert "users" {:name "Robert" :city "Brussels" :age (int 30)}) 


间 的 create- 


可 以 用 select 查询 来 访问 这 些 记录 。 例 如 ， 如 果 需 要 取出 表 中 的 所 有 用 户 ， 或 在 查询 时 使 





用 Limit， 可 以 执行 : 














;; 获取 所 有 用 户 


(cql/select "users") 
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;; 获取 前 19 个 用 户 
(cql/select "users" (q/limit 10)) 




















或 者 ， 如 果 需 要 按 指定 的 name 获取 一 个 人 的 信息 ， 可 以 添加 where 子 句 : 


(cql/select "users" (q/where :name "Alex")) 


讨论 

Cassandra 是 一 个 开源 软件 ， 实 现 了 Amazon 的 里 程 碑 式 的 Dynamo 论文 (http://www. 
allthingsdistributed.com/files/amazon-dynamo-sosp2007.pdf) 中 的 许多 思想 。 它 是 一 个 键 值 对 
数据 库 ， 不 关心 表 和 数据 点 之 间 的 任何 关系 。Cassandra 是 分 布 式 的 数据 库 ， 是 为 高 可 用 
性 而 设计 的 。 为 此 ， 它 在 集群 中 复制 数据 。 数 据 元 余 存 储 在 多 个 节点 中 。 如 果 一 个 节点 失 
效 ， 数 据 仍 然 可 以 从 不 同 的 节点 或 多 个 节点 中 获取 。 


如 果 数 据 相 当 大 ，Cassandra 就 更 有 意义 了 ， 因 为 它 就 是 为 分 布 式 结构 而 设计 的 ， 可 以 扩 
大 读 写 的 规模 ， 并 很 好 地 管理 数据 库 的 一 致 性 和 可 用 性 。Cassandra 很 好 地 处 理 了 网 络 分 
断 ， 所 以 即使 有 几 个 节点 在 一 段 时 间 内 不 可 用 ， 仍 能 读 写 数 据 ， 一 直到 网 络 分 断 恢复 。 如 
果 数 据 相 当 小 ， 在 近期 内 不 太 会 大 量 增长 ， 而 且 需 要 对 数据 集 执行 许多 特别 的 查询 ， 那 么 
Cassandra 可 能 就 不 太 适 合 。 







































































一 致 性 和 可 用 性 是 可 以 调整 的 值 。 可 以 通过 牺牲 数据 一 致 性 ， 获 得 更 好 的 可 用 性 : 在 网 络 
分 断 时 ， 并 非 所 有 市 点 都 保持 了 数据 的 最 后 快照 ， 但 仍然 可 以 响应 读 和 写 的 请 求 。 相 反 ， 
如 果 选 择 更 强 的 一 致 性 ， 延 迟 就 会 增加 ， 因 为 读 和 写 需 要 更 多 节点 成 功 啊 应 。 如 果 对 数据 
点 没有 冲突 的 写 信 ， 最 终 所 有 市 点 都 将 持 有 最 新 的 值 ， 最 终 一 致 性 将 得 到 保证 。 


像 大 多 数据 库 一 样 ，Cassandra 有 独立 数据 库 的 概念 (Cassandra 的 术语 是 “ 键 空间 ”)。 每 
个 键 空间 包含 一 些 表 (有 时 候 称 为 “ 列 族 ”)。 表 中 包含 行 ， 行 中 包含 列 。 每 个 列 有 和 键 ( 列 
名 )、 值 、 写 入 时 间 惟 和 生存 期 。 


















































Cassandra 使 用 两 种 不 同 的 通信 协议 : 较 老 的 二 进 制 协议 名 为 Thrift， 以 及 CQL (Cassandra 
查询 语言 )。Cassaforte 中 的 所 有 操作 背后 都 生成 CQL。 下 面 两 个 例子 说 明 这 些 操 作 如 何在 
内 部 编译 成 CQL: 





(cql/select "users" (q/where :name "Alex")) 
;; SELECT * FROM users WHERE name='Alex'; 


(cql/insert "users" {:name "Alex" :city "Munich" :age (int 26)}) 
;; INSERT INTO users (name, city) VALUES ('Munich', 26); 




















Cassandra 能 做 的 远 不 止 创建 表 和 插入 值 。 如 果 想 更 新 数据 库 中 的 记录 ， 可 以 调用 update 
函数 : 








(cql/update "users" 
{:city "Berlin"} 
(q/where :name "Alex")) 


从 数据 库 中 删除 记录 同样 容易 : 


;; 将 只 删除 一 个 用 户 
(cql/delete :users (q/where :name "Alex")) 









































;; 将 删除 名 字 与 IN 子 句 匹配 的 所 有 用 户 
(cql/delete :users (q/where :name [:in ["Alex" "Robert"]])) 











如 果 想 执行 任意 的 CQL 语句 ， 不 用 Cassaforte 的 基于 宏 的 DSL， 可 以 向 client/execute 
函数 传递 一 个 字符 串 : 


(client/execute 
"INSERT INTO users (name, city, age) VALUES ('Alex', 'Munich', 19);") 





对 于 每 次 写 人 ， 可 以 指定 一 个 可 选 的 生存 期 ， 让 数据 在 一 段 时 间 之 后 过 期 。 这 对 于 缓存 和 
只 想 保留 一 段 时 间 的 数据 (如 用 户 会 话 ) 是 有 用 的 。 例 如 ， 如 果 和 希望 记录 只 生存 60 秒 ， 
可 以 执行 : 


(cql/insert "users" {:name "Alex" :city "Munich" :age (int 26)} 
(q/using :ttL 60)) 


Cassandra 中 另 一 个 受 欢 迎 的 概念 是 分 布 式 计数 器 。 计 数 器 列 提供 了 一 种 有 效 的 方式 ， 


对 你 需要 的 任何 东西 计数 或 求 和 。 这 是 通过 值 的 原子 增加 和 减少 操作 来 实现 的 。 要 从 
Cassaforte 中 创建 一 个 带 计数 器 的 表 ， 可 以 使 用 :counter 列 类 型 ; 





(cql/create-table :scores 
(q/column-definitions {:username :varchar 
:score :counter 
:primary-key [:username]})) 


可 以 通过 increment-by 和 decrement-by 查询 来 增 减 计 数 器 : 


(cql/update :scores 
{:score (q/increment-by 50)} 
(q/where :name "Alex")) 


(cql/update :scores 
{:score (q/decrement-by 5)} 
(q/where :name "Robert")) 


sh 
En 


。 Cassaforte 的 文档 (http://clojurecassandra.info/ a 
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6.8 使 用 MongoDB 


作者 : Clinton Dreisbach 


问题 





希望 使 用 保存 在 MongoDB 中 的 数据 。 


解决 方案 


使 用 Monger (http://clojuremongodb.info/) 来 连接 MongoDB， 查 找 或 操作 数据 。Monger 


是 Java MongoDB 驱动 的 Clojure 包装 。 


利用 Clojure 代码 访问 Mongo 之 前 ， 必 须 运 行 要 连接 的 MongoDB 实例 。 如 何在 本 地 
系统 安装 MongoDB， 请 参考 MongoDB 的 安装 指南 (http://docs.mongodb.org/manual/ 


installation/) 。 


如 果 你 已 准备 好 编写 Clojure 的 MongoDB 客户 端 ， 就 用 Lein-try 启动 REPL : 


要 连接 MongoDB ， 请 使 用 monger .core/connect! 国 数 。 它 将 连接 保存 在 动态 var *mongodb- 
connection* 中 。 如 果 和 希望 取得 连接 并 且 不 将 它 保存 在 动态 var 中 ， 可 以 monger.core/ 


$ lein try com.novemberain/monger 








connect 函数 ， 带 上 同样 的 选项 : 





(require '[monger.core :as mongo]) 


;; 连接 LocaLhost 
(mongo/connect! {:host "127.0.0.1" :port 27017}) 








;; 完成 后 断 开 连 接 


(mongo/disconnect!) 








在 连接 成 功 后 ， 可 以 方便 地 插入 和 查询 文档 : 





(require '[monger.core :as mongo] 
'[monger .coLLection :as coll]) 
(import '[org.bson.types ObjectId]) 


;; 在 var *mongodb-database* 中 设置 数据 库 
(mongo/use-db! "mongo-time") 


;; 插入 一 个 文档 


(coll/insert "users" {:name "Jeremiah Forthright" :state "TX"}) 











;; 插入 一 批文 档 


(coll/insert-batch "users" [{:name "Pete Killibrew" :state "KY"} 








{:name "Nendy Perkins" :state "OK"} 
{:name "Steel Whitaker" :state "OK"} 
{:name "Sarah LaRue" :state "WY"}]) 


;; 查找 所 有 文档 ， 返 回 一 个 com.mongodb.DBCursor 
(coll/find "users") 








;; 查找 符合 查询 条 件 的 所 有 文档 ， 返 回 一 个 DBCursor 
(coll/find "users" {:state "OK"}) 


;; 查找 文档 ， 作 为 Clojure 映射 表 返 回 
(coll/find-maps "users" {:state "OK"}) 

;; -> ({:_id #<0bjectId 520...>, :state "OK", :name "Wendy Perkins"} 
i {:_id #<0bjectId 520...>, :state "OK", :name "Steel Whitaker"}) 











;; 查找 一 个 文档 ， 返 回 一 个 com.mongodb .DBObject 
(coll/find-one "users" {:name "Pete Killibrew"}) 

















;; 查找 一 个 文档 ， 作 为 一 个 Clojure 映射 表 返 回 
(coll/find-one-as-map "users" {:name "Sarah LaRue"}) 
;; -> {:_id #<0bjectId 520...>, :state "WY", :name "Sarah LaRue"} 


讨论 
MongoDB， 特 别 是 用 了 Monger 后 ， 可 能 是 保存 Clojure 数据 的 自然 选择 。 它 以 BSON 
(二 进 制 JSON) 格式 保存 数据 ， 很 符合 Clojure 自己 的 向 量 和 映射 表 。 有 几 种 方法 连接 
Mongo， 这 取决 于 需要 对 连接 进行 多 少 定制 ， 以 及 使 用 选项 映射 表 还 是 URI: 

















;; 默认 连接 LocatLhost 的 27617 端口 
(mongo/connect!) 


;; 连接 另 一 个 机 器 
(mongo/connect! {:host "192.168.1.100" :port 27017}) 


;; 利用 更 多 复杂 选项 来 连接 
(Let [options (mongo/mongo-options :auto-connect-retry true 
:Connect-timeout 15 
:socket-timeout 15) 
server (mongo/server-address "192.168.1.100" 27017)] 
(mongo/connect! server options)) 








;; 通过 URI 来 连接 
(mongo/connect-via-uri! (System/genenv "MONGOHQ_URL")) 

sl 为 每 个 文档 提供 一 个 -id 是 可 选 的 。 2 就 会 自动 创建 一 
。 但 如 果 将 来 需要 引用 该 文档 ， 自 己 添加 id 是 有 意义 
































(require '[monger.collection :as coLL]) 
(import '[org.bson.types ObjectId]) 


(Let [id (ObjectId.) 
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user {:name "LoLa Morales"}] 
(coll/insert "users" (assoc User :_id id)) 
;; 以 后 ,通过 id 查找 用 户 
(coll/find-map-by-id "users" id)) 
;; -> {:_id #<0bjectId 521...>, :name "Lola Morales"} 


在 习惯 用 法 中 ，Monger 设置 为 使 用 一 个 连接 和 一 个 数据 库 ， 因 此 monger .core/connect! 和 
monger .core/use-db! 设置 了 动态 var 来 保存 它们 的 信息 。 

















但 是 ， 绕 开 它 是 很 容易 的 。 可 以 用 binding 在 代码 中 明确 设置 它们 。 另 外 ， 可 以 用 monger. 
multi.collection 命名 空间 代替 monger .collection。monger .multi.collection 命名 空间 中 


的 所 有 函数 ， 都 接受 数据 库 作为 第 一 个 参数 : 








(require '[monger.core :as mongo] 
'[monger .multi.collection :as multi]) 


(mongo/connect!) 





;; use-db! 接受 一 个 字符 串 作为 数据 库 ， 因 为 它 是 一 个 方便 的 函数 ， 
;; 但 对 于 monger .multi.collection 和 其 他 函数 ， 我 们 需要 用 get-db 来 取得 数据 
(Let [stats-server (mongo/connect "stats.example.org") 

app-db (mongo/get-db "mongo-time") 

geo-db (mongo/get-db "geography")] 














刘 


;; 在 stats 服务 器 中 记录 数据 
(binding [mongo/*mongodb-connection* stats-server] 
(multi/insert (mongo/get-db "stats") "access" 
{:ip "127.0.0.1" :time (java.util.Date.)})) 








;; 在 应 用 DB 中 查找 用 户 
(multi/find-maps app-db "users" {:state "WY"}) 














;; 在 地 理 DB 中 插入 正方 形 
(multi/insert geo-db "shapes" 
{:name "square" :sides 4 
:parallel true :equal true})) 


monger .collection 中 的 基本 查找 函数 适用 于 简单 的 查询 ， 但 你 很 快 会 发 现 需 要 更 复杂 的 查 
询 ， 这 时 就 需要 monger .query。 这 是 针对 MongoDB 查询 的 领域 特定 语言 : 


(require '[monger.query :as q]) 











;; 查找 用 户 ， 跳 过 前 两 个 ， 取 得 接 下 来 的 三 个 
(q/with-collection "users" 

(q/find {}) 

(q/skip 2) 

(q/limit 3)) 

















;; 取得 所 有 来 自 0kLahoma 州 的 用 户 ， 按 名 字 排 序 
;; 排序 时 必须 用 array-map， 可 以 保持 键 有 序 
(q/with-collection "users" 

(q/find {:state "OK"}) 

















(q/sort (array-map :name 1))) 


;; 取得 所 有 不 是 来 自 0kLahoma 州 或 者 名 字 以 "S" 开头 的 用 户 
(q/with-collection "users" 
(q/find {"$or" [{:state {"$ne" "OK"}} 
{:name #"^S"}]})) 





。 Monger 的 文档 (http:/clojuremongodb.info/) 。 
。 CongoMongo(https://github.com/aboekhoff/congomongo), 另 一 个 使 用 MongoDB 的 Clojure 库 ， 
你 也 许可 以 考虑 。 


6.9 使 用 Redis 


作者 : Jason Webb 


问题 
希望 使 用 Redis 中 的 数据 。 


解决 方案 


用 Carmine (https://github.com/ptaoussanis/carmine) 连接 Redis， 并 与 之 交互 。 





要 继续 这 个 实例 ， 应 该 先 安装 Redis， 并 在 本 地 运行 。 可 以 在 官方 Redis 下 
载 页 面 (http://redis.io/download) 找到 安装 Redis 的 详细 说 明 。 如 果 系 统 是 
Windows， 可 以 看 看 Microsoft Open Tech GitHub Redis 项 目 (https://github. 
com/MSOpenTech/redis) 




















要 继续 这 个 实例 ， 就 在 项 目 依赖 关系 中 添加 [com.taoensso/carmine "2.2.9"], 或 用 Lein- 
try 启动 REPL: 
$ lein try com.taoensso/carmine 
要 使 用 Carmine， 必 须 先 定 义 连接 规格 说 明 : 
(def server-connection {:pool {:max-active 8} 
:spec { :host "LocaLhost" 
:port 6379 


;;:password "" 
:timeout 4000}}) 


Carmine 支持 所 有 的 Redis 命令 ， 名 称 ( 绝 大 部 分 ) 与 Redis 文档 相符 。 用 wcar 函数 和 连 
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接 规 格 说 明 server-connection 来 发 送 你 熟悉 和 喜欢 的 Redis 命令 : 
(require “[taoensso.carmine :as Car :refer (wcar)]) 


(wcar server-connection (car/set "Nick" "Nack")) 


;; -> "OK" 

(wcar server-connection (car/get "Nick")) 

;; -> "Nack" 

(wcar server-connection (car/hset "founder" "name" "Tim")) 
;; ->0 

(wcar server-connection (car/hset "founder" "age" 59)) 

;; ->0 


(wcar server-connection (car/hgetall "founder")) 
-> [name Tim age 59] 


传人 多 个 命令 会 形成 管道 ， 结 果 作 为 向 量 一 起 返回 : 


(wcar server-connection (car/set "paddywhacks" 0) 
(car/incr "paddywhacks") 
(car/get "paddywhacks")) 
;; -> ["OK" 1 "1"] 


讨论 
Redis 称 自己 是 数据 结构 服务 器 。 由 于 数据 结构 与 Clojure 中 的 核心 数据 结构 类 似 ， 它 们 很 


适合 一 起 解决 各 种 问题 。Redis 的 速度 和 键 / 值 存储 ， 让 它 特 别 适合 实现 缓存 和 应 用 内 存 化 
( 稍 后 进一步 讨论 )。 




















通过 将 wcar 的 调用 包装 在 宏 中 ， 传 入 连接 规格 说 明 ， 就 可 以 消除 一 些 引 用 : 
(defmacro wcar* [& body] ‘(car/wcar server-connection ~@body)) 


(wcar* (car/set "Nick" "Nack")) 
;; -> "OK" 

(wcar* (car/get "Nick")) 

;; -> "Nack" 


序列 化 是 自动 处 理 的 ， 在 大 多 数 情况 下 有 效 。 只 要 传人 你 想 保存 的 数据 ，Carmine 将 自动 
完成 序列 化 / 反 序 列 化 : 





(wcar* (car/set "some-key" {:event "An Event", :timestamp (new java.util.Date)}) 
(car/get "some-key")) 
;; -> [OK {:event An Event, :timestamp #inst "2013-08-18T21:31:33.993-00:00"}] 

















只 要 你 坚持 使 用 Clojure 核心 数据 类 型 ， 大 多 数 情 况 下 都 会 得 到 理想 的 结果 。 但 是 ， 如 果 
需要 支持 保存 定制 的 数据 类 型 ， 就 要 利用 底层 的 序列 化 库 ， 名 为 Nippy。 更 多 信息 请 参见 
Nippy 的 GitHub 项 目 (https://github.com/ptaoussanis/nippy )。 

















Redis 很 适合 作为 内 存 化 存储 后 端 。 显 然 ， 在 评估 内 存 解决 方案 时 ， 有 一 些 严 肃 的 折 中 要 考 





虑 ， 如 core.cache 库 。 但 是 如 果 方 案 正 确 ， 将 获得 很 大 的 提升 。 例 如 ， 请 考虑 将 一 个 函数 内 
存 化 ， 它 访问 一 个 外 部 的 Web 服务 ， 取 得 当前 的 天 气 信息 。 通 过 很 少 的 工作 ， 多 个 服务 器 
就 能 共享 最 新 的 数据 ， 甚 至 让 过 时 的 数据 自动 过 期 并 刷新 。 下 面 的 例子 就 是 这 样 一 种 情况 : 




















(defn redis-memoize 
"Convert a function to one that is memoized using Redis as storage." 
[key-prefix ttL-seconds connection-spec f] 
(fn [& args] 
(let [key-name [key-prefix args]] 
(if-let [found-result (wcar connection-spec (car/get key-name))] 
found-result 
(let [new-result (apply f args)] 
(wcar connection-spec (car/set key-name new-result) 
(car/expire key-name ttl-seconds)) 
new-result))))) 


值得 一 提 的 是 ， 这 里 作 了 一 些 假定 。 首 先 ， 它 假定 被 内 存 化 的 函数 所 带 的 参数 是 Nippy 文 
持 的 (请 看 前 面 序列 化 的 例子 )。 其 次 ， 它 假定 内 存 化 的 数据 应 该 在 指定 的 秒 数 后 过 期 。 
要 使 用 redis-memoize， 只 要 传人 一 个 函数 。 下 面 设 计 极 为 精巧 的 例子 使 用 了 前 面 定义 的 


server-connection. 


























(defn square [x] 
(printf "Ran square for: %s\n" x) 


(* x x)) 


(def redis-squared 
(redis-memoize "squared" 10 server-connection square)) 


(redis-squared 99) 
;; -> Ran square for: 99 


;; -> 9801 
(redis-squared 99) 
;; -> 9801 





除了 前 面 列 出 的 特征 ，Carmine 还 包括 (但 不 限于 ) 消息 队列 ， 分 布 式 锁 ，Ring 会 话 库 ， 
甚至 DynamoDB 的 实现 (在 本 书 编写 时 还 处 于 alpha 阶段 )。 这 些 特征 超出 了 本 实例 的 范 
围 ， 但 它们 有 很 好 的 文档 ， 很 容易 使 用 。 更 多 信息 请 参考 Carmine 的 GitHub 项 目 (https:// 


github.com/ptaoussanis/carmine ) 。 
































参阅 

。 Carmine 的 GitHub 项 目 (https://github.com/ptaoussanis/carmine) ,了解 关于 Carmine 的 更 多 信息 。 
。 官方 Redis 文档 (http:/redis.io/commands) ， 了 解 完 全 的 Redis 命令 清单 。 
。 Nippy 的 GitHub 项 目 (https:Wgithub.comy/ptaoussanis/nippy) ， 了 解 序列 化 的 信息 。 

。 Clojure 的 核心 文档 (http://clojuredocs.org/clojure_core/clojure.core/memoize/clojure.core/ 


memoize)， 了 解 nemoize 国 数 的 文档 。 
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6.10 连接 Datomic 数 据 库 


作者 : Robert Stuttaford 


问题 
需要 连接 Datomic 数据 库 。 
解决 方案 


开始 之 前 ， 在 项 目 依赖 关系 中 添加 [com.datomic/datomic-free "0.8.4218"]， 或 用 Lein- 
try 开始 REPL: 








$ lein try com.datomic/datomic-free 


要 创建 并 连接 到 一 个 内 存 数据 库 ， 就 用 database.api/create-database 和 datomic.api/ 


connect. 





(require '[datomic.api :as d]) 
(def uri "datomic:mem://sample-database") 


(d/create-database uri) 
;; -> true 


(def conn (d/connect uri)) 


conn 
;; -> #<LocalConnection datomic.peer.LocalConnection@49384d99> 











建立 连接 后 ， 就 可 以 利用 它 ， 通 过 datontc.api/db 取得 数据 库 的 值 。 这 个 值 将 用 于 查询 数 
据 库 ; 


(def db (d/db (d/connect uri))) 














db 
;; -> datomic.db.Db@7b7fea26 


也 可 以 通过 datomic.api/transact 利用 连接 来 处 理 数 据 事务 : 


蛙 








;; i 上 schema 支持 事务 ， 目 的 是 接 下 来 的 大 事情 
(def my-great-schema []) ; 这 个 向 量 是 有 意 为 空 的 
(d/transact (d/connect uri) my-great- SEN 和) 




















在 解决 方案 中 你 会 广 意 到 ， 我 们 不 仅 连接 了 数据 库 ， 而 且 创建 了 它 。 这 在 使 用 内 存 数 据 库 

















时 是 很 常见 的 ， 因 为 在 新 的 JVM 中 没有 内 存 数据 库 。 如 果 数 据 库 已 存在 ， 就 不 一 定 要 调 
用 create-database， 但 这 样 做 比较 安全 ， 因 为 create-database 是 需 等 的 ， 如 果 数 据 库 已 
存在 ， 它 会 返回 false。 如 果 连 接 的 数据 库 不 在 内 存 中 ， 就 需要 相关 的 事务 管理 器 和 存储 
服务 进入 运行 状态 。 

d/connect 的 返回 值 会 在 查询 数据 库 中 的 值 或 执行 数据 事务 时 用 到 。 在 读 取 事务 日 志 ， 消 
费事 务 报告 队列 ， 执 行 管理 任务 ， 如 要 求 建立 索引 、 垃 圾 收集 、 释 放 连 接 相关 的 资源 时 ， 
也 会 用 到 它 。 连 接 是 线程 安全 的 ， 由 URI 在 内 部 缓存 ， 所 以 不 需要 自己 建立 连接 池 。 对 同 
一 个 URI 建立 许多 连接 也 没有 性 能 开销 。 

存储 服务 

Datomic 事务 管理 器 进程 对 于 并 发 连接 的 进程 数 有 限制 。Datomic Free 对 每 个 事务 管理 器 
限制 两 个 连接 。 对 于 非 分 布 式 应 用 ， 这 可 能 已 足够 。 如 果 你 要 构建 大 型 服务 ， 那 就 需要 
Datomic Pro 的 许可 证 ， 支 持 更 多 连接 。 


有 一 些 选 项 是 针对 后 端 为 Datomic 的 存储 服务 的 。 三 个 选项 是 内 建 的 ， 其 他 选项 用 到 了 
外 部 服务 。Datomic Free 包括 对 内 存 和 :free 存储 后 端的 访问 。Datomic Pro 和 Pro Starter 
Edition 包括 对 所 有 服务 的 访问 。 


内 建 的 存储 选项 
以 下 是 内 建 的 存储 选项 。 






















































































。 本 地 内 存 : "datomic:mem://[db-name]"; 
。 Free, 使 用 Datomic Free, 有 两 个 连接 的 限制 : "datomic:free://host[:port]/[db-name]"; 
。 Dev, 使 用 Datomic Pro, 受 许可 的 连接 数 限制 : "datomic:dev://host[:port]/[db-name]"。 








Free 版 和 Dev 版 也 可 以 配置 使 用 别 的 端口 作为 存储 : "datomic:free://host[:port]/[db- 
name]?h2-port=[port]j&h2-web-port=[port]"。 默 认 情 况 下 ， 这 些 端 口 依次 排 在 事务 管理 器 
端口 之 后 。 


外 部 存储 服务 选项 
还 有 几 个 外 部 存储 选项 。 























。 DynamoDB : "datomic:ddb://[aws-region]/[dynamodb-tablel/[db-name]? aws_access_ 
key_id=[XXX]&aws_secret_key=[YYY]"; 

。 Riak: "datomic:riak://host[:port]/bucket/dbname[?interface=httplproto buf]" ( 默 
认 是 protobuf) ， 

。 Couchbase: "datomic:couchbase://host/bucket/dbname[?password=xxx]"; 

。 Infinispan: "datomic:inf://[cluster-member-host:port]/[db-name]",; 


。 SQL: "datomic:sql://[db-name][?jdbc-url]", 
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对 于 SQL 存储 服务 ， 可 以 用 映射 表格 式 代 替 字 符 串 格式 。 如 果 要 指定 不 能 颈 入 URI 字符 
串 中 的 对 象 ， 如 DataSsource， 这 是 有 用 的 。SQL 映射 表 的 格式 是 : 


{:protocol :sql ;; 关键 字 或 字符 串 
:db-name "[db-name]" ;; 关键 字 或 字符 串 
:data-source aDataSourceObject 
;; OR 


:factory aCallableReturningConnection} 


阅 

。 6.11 市 “为 Datomic 数据 库 定义 数据 模式 ”。 

。 6.12 节 “ 向 Datomic 写 入 数据 ”。 

。 Datomic Pro Starter Edition (http://blog.datomic.com/2013/11/datomic-pro-starter-edition. 


html) ， 了 解 免费 访问 所 有 存储 和 Datomic 控制 台 。 


6.11 为 Datomic 数 据 库 定义 数据 模式 


作者 : Robert Stuttaford 





问题 
需要 定义 数据 在 Datomic 中 的 模型 。 例 如 ， 需 要 对 用 户 和 用 户 组 建 模 ， 以 某 种 方式 关联 
起 来 。 


解决 方案 

Datomic 数据 模式 是 以 属性 的 方式 来 定义 的 。 了 解 它 最 容易 的 方法 是 直接 看 例子 。 

要 继续 本 实例 ， 请 完成 6.10 节 “ 连 接 Datomic 数据 库 ” 中 的 步 又。 然后， 你 就 有 了 一 个 内 
存 数据 库 和 连接 conn。 

考虑 用 户 可 能 有 的 属性 : 

。 email 地 址 ， 在 数据 库 中 必须 唯一 ; 

。 姓名 ， 对 它 索 引 以 便 快 速 查找 ; 

。 任意 多 个 角色 (访客 、 作 者 和 编辑 ) 。 


要 定义 这 个 数据 模式 ， 就 要 创建 一 个 向 量 ， 其 中 包含 email、 姓 名 和 角色 的 属性 映射 表 ， 
并 插入 三 种 不 变 的 角色 : 

















(def user-schema 
[{:db/doc "User email address" 





:db/ident :user/email 

:db/valueType :db.type/string 
:db/cardinality :db.cardinality/one 
:db/unique :db.unique/identity 
:db/id #db/id[:db.part/db] 
:db.install/_attribute :db.part/db} 


{:db/doc "User name" 
:db/ident :user/name 
:db/valueType :db.type/string 
:db/cardinality :db.cardinality/one 
:db/index true 
:db/id #db/id[:db.part/db] 
:db.install/_attribute :db.part/db} 


{:db/doc "User roles" 
:db/ident :user/roles 
:db/valueType :db.type/ref 
:db/cardinality :db.cardinality/many 
:db/id #db/id[:db.part/db] 
:db.install/_attribute :db.part/db} 


Li 


:db/add #db/id[:db.part/user] :db/ident :user.roles/guest] 
:db/add #db/id[:db.part/user] :db/ident :user.roles/author] 
:db/add #db/id[:db.part/user] :db/ident :user.roles/editor]]) 


Tj 


我 们 定义 用 户 组 的 属性 包括 : 


。 UUID， 在 数据 库 中 必须 唯一 ， 
。 名 称 ， 对 它 索 引 以 便 快 速 查 找 ， 
。 任意 多 个 相关 的 用 户 。 











这 样 定 义 用 户 组 : 





(def group-schema 
[{:db/doc "Group UUID" 

:db/ident :group/uuid 
:db/valueType :db.type/uuid 
:db/cardinality :db.cardinality/one 
:db/unique :db.unique/value 
:db/id #db/id[:db.part/db] 
:db.install/_attribute :db.part/db} 


{:db/doc "Group name" 
:db/ident :group/name 
:db/valueType :db.type/string 
:db/cardinality :db.cardinality/one 
:db/index true 
:db/id #db/id[:db.part/db] 
:db.install/_attribute :db.part/db} 


{:db/doc "Group users" 
:db/ident :group/users 
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:db/valueType :db.type/ref 
:db/cardinality :db.cardinality/many 
:db/id #db/id[:db.part/db] 
:db.install/_attribute :db.part/db}]) 


最 后 ， 用 transact 函数 将 两 个 数据 模式 定义 通过 连接 传 入 数据 库 : 





(require '[datomic.api :as d]) 


@(d/transact (d/connect "datomic:mem://sample-database") 
(concat user-schema group-schema)) 
;; -> {:db-before datomic.db.Db@25b48c7b, 


a :db-after datomic.db.Db@5d81650c, 
人 :tx-data [#Datum{:e ...:a...:vV ... :tx :added true}, ...], 
pa :tempids {-... ... i 

外 * 八 

讨论 





Datomic 数据 模式 表示 为 Clojure 数据 ， 并 在 一 个 事务 中 添加 到 数据 库 ， 就 像 存储 的 其 他 数 








据 一 样 。:db.install/_attribute :db.part/db 键 / 值 对 被 事务 管理 
部 分 能 使 用 这 个 数据 模式 。 





























器 使 用 ， 让 系统 的 其 他 





数据 模式 放 在 :db.part/db 数据 库 分 区 中 ， 该 分 区 专 为 数据 模式 保留 。 所 有 用 户 数据 放 在 











用 户 分 区 中 ， 要 么 是 默认 的 :db.part/user ， 要 么 是 定制 的 分 区 。 分 


区 有 助 于 优化 索引 如 何 





排序 数据 ， 从 而 有 助 于 优化 查询 。 数 据 模式 实体 要 求 至 少 提供 :db/ident、:db/valueType 





和 :db/cardinality 值 





o 





除了 数据 模式 ，Datomic 对 任何 实体 都 不 强制 
义 数据 模式 ， 在 运行 时 强制 满足 类 型 和 唯一 性 约束 。 


do, 

















属性 必须 组 合 使 用 。Datomic 只 要 求 必须 先 定 


在 数据 模式 :db/ident 的 值 中 使 用 命名 空间 ， 有 助 于 对 实体 分 类 (如 :user/email 中 的 
user) 。Datomic 对 命名 空间 不 作 任 何 特殊 处 理 ， 使 用 它们 是 可 选 的 。:db/valueType 有 几 








个 选项 ， 在 表 6-1 中 列 出 。 


表 6-1: db/ 值 类 型 选项 


:db.type/keyword :db.type/string :db.type/Long 
:db.type/boolean :db.type/bigint :db.type/fLoat 
:db.type/double :db.type/bigdec :db.type/instant 
:db.type/ref :db.type/uuid :db.type/uri 


:db.type/bytes 











其 语义 的 详尽 列表 ， 参 见 Datatomic 数据 模式 文档 (http:/docs.datomic.com/schema.html) 。 








带 有 :db/vaLueType :db.type/ref 的 属性 只 能 用 其 他 实体 作为 它们 的 值 。 可 以 用 这 个 类 型 来 
建 模 实体 间 的 关系 。Datomic 不 强制 哪些 实体 与 给 定 的 :db/valueType :db.type/ref 属性 关 
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联 。 任 何其 他 实体 都 可 以 关联 ， 这 意味 着 实体 可 以 与 自己 关联 ! 














可 以 用 :db/valueType :db.type/ref 和 一 些 单独 的 :db/ident 值 来 建 模 枚 举 值 ， 例 如 前 画 
定义 的 用 户 角 色 。 这 些 枚 举 值 其 实 不 是 数据 模式 ， 它 们 是 普通 的 实体 ， 带 有 唯一 属性 :db/ 
ident。 实 体 的 :db/ident 值 可 以 作为 该 实体 的 简写 ， 在 事务 和 查询 中 ， 可 以 用 这 个 值 代替 
实体 的 :db/id 值 。 





























带 有 :db/valueType :db.type/ref 和 :db/unique 值 的 属性 是 隐 式 索引 的 ， 就 像 定义 中 添加 
了 :db/index true 一样 。 





+ 








也 可 以 对 字符 串 属 性 使 用 Lucene 的 全 文本 索引 ， 使 用 :db/fulltext true 和 系统 在 
Datalog 中 定义 的 fulltext 函数 。 


在 :db/unique 中 指定 唯一 性 约束 时 有 两 个 选项 。 











:db.unique/value 


对 不 同 的 实体 了 ， 不 允许 尝试 插入 重复 的 值 。 





:db.unique/identity 
指定 属性 值 对 每 个 实体 是 唯一 的 ， 并 支持 更 新 插入 。 对 临时 实体 ID 插入 重复 的 值 的 任 
何尝 试 ， 都 将 导致 所 有 与 该 临时 ID 关联 的 属性 与 数据 库 中 原来 的 实体 合并 。 


如 果 要 建 模 的 实体 带 有 子 实体 ， 只 存在 于 那些 实体 的 上 下 文中 ， 例 如 订单 中 的 订单 项 或 产 
品 的 变种 ， 就 可 以 用 :db/isComponent 来 简化 这 种 子 实体 的 处 理 。 它 只 能 用 于 :db.type/ 
ref 类 型 的 属性 。 


如 果 在 事务 中 使 用 :db.fn/retractEntity 国 数 ， 被 回 撤 实体 中 这 种 属性 对 应 的 值 实体 也 会 
被 回 撤 。 而 且 ， 如 有 果 用 d/touch 来 实现 实体 映射 表 中 的 所 有 人情 性 键 ， 组 件 实例 也 会 被 实现 。 
回 撤 和 实现 行为 都 是 递归 的 。 


默认 情况 下 ，Datomic 保存 属性 过 去 所 有 的 值 。 如 果 对 某 个 属性 不 希望 保存 过 去 的 值 ， 就 
用 :db/noHistory true， 让 Datomic 丢弃 以 前 的 值 。 使 用 这 个 属性 很 像 使 用 传统 的 就 地 更 
新 (update-in-place) 数据 库 。 




























































































参阅 
。 6.12 节 “ 向 Datomic 写 入 数据 "， 了 解 关 于 datoms (schemas!) 


6.12 回 Datomic 写 入 数据 


作者 : Robert Stuttaford 





出 叫 


有 务 的 更 多 信息 。 
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问题 

需要 向 Datomic 数据 库 添 加 数据 。 
解决 方案 

用 Datomic 连接 来 实现 数据 事务 。 


要 继续 本 实例 ， 请 完成 6.10 节 “ 连 接 Datomic 数据 库 ” 和 6.11 节 “ 为 Datomic 数据 库 定义 
数据 模式 ”中 的 步骤 。 


， 你 就 有 了 连接 conn 和 数据 模式 ， 可 以 插入 数据 : 








(require '[datomic.api :as d :refer [q db]]) 


(def tx-data [{:db/id (d/tempid :db.part/user) 

:User/email "fowler@acm.org" 

:User/name "Martin Fowler" 

:user/roles [:user.roles/author :user.roles/editor]}]) 
@(d/transact conn tx-data) 


(q '[:find ?name 
:where [?e :user/name ?name]] 
(:db-after tx-result)) 
;; -> #{["Martin Fowler"]} 


讨论 
这 种 基于 映射 表 的 数据 表示 语法 ， 将 扩展 成 一 系列 :db/add 语句 。 下 面 的 事务 与 前 面 的 


等 价 : 














(def new-id (d/tempid :db.part/user)) 
new-id 
;; -> #db/id[:db.part/user -1000013] 


(def tx-data2 [[:db/add new-id :user/email "ryan@cognitect.com"] 
[:db/add new-id :user/name "Ryan Neufeld"] 
[:db/add new-id :user/roles [:user.roles/author 
:User.roLes/editor]]]) 


(def tx-result @(d/transact conn tx-data2)) ;; Keep this for later... 


(q '[:find ?name 
:where [?e :user/name ?name]] 
(db conn)) 
;; -> #{["Ryan Neufeld"] ["Martin Fowler"]} 





当然 ， 你 可 以 使 用 这 样 的 语句 ， 也 可 以 用 解决 方案 中 的 映射 表 语 法 ， 还 可 以 混合 使 用 。 
是 对 多 个 条 目 执行 事务 的 方法 (例如 ，(d/transact conn [person1-map 








你 会 注意 到 ， 了 映射 表 和 扩展 后 的 形式 之 间 有 一 点 差别 ， 即 缺少 针对 :db/id 键 的 :db/add 语 


句 。 在 扩展 后 的 形式 中 ， 


性 ， 这 个 值 必须 相等 。 如 果 将 实体 指定 为 映射 表 ， 只 要 提供 一 个 ID， 事 务 处 理 器 会 透明 地 


加 在 每 个 属性 前 面 。 





什么 ID 合适 ? 新 的 实体 都 会 指定 负 的 临时 ID 值 ， 可 以 在 事务 中 用 它 对 关系 建 模 。 在 事 
务 成 功 时 ， 所 有 临时 ID 都 会 被 赋予 数据 库 中 正 的 耳 值 。 在 代码 中 ， 正 确 的 方法 是 用 








这 个 值 紧 跟 在 动作 (:db/add) 之 后 ， 对 同一 个 实体 的 所 有 相关 属 





















































uy 




















datomic.api/tempid 国 数 得 到 临时 ID。datomic.api/tempid 国 数 接受 一 个 分 区 关键 字 和 一 
个 可 选 的 ID 作为 参数 ， 对 于 大 多 数 情 况 ，:db.part/user 就 足够 了 。 











在 处 理 不 可 执行 的 数据 时 ， 需 要 用 数据 字面 量 的 形式 来 表示 临时 ID。 字 面 量 #db/id [:db. 











part/user] 等 价 于 (d/tempid :db.part/user)。 如 果 将 事务 数据 保存 在 .edn 文件 中 ， 这 
种 形式 就 特别 有 用 。 在 数据 模式 定义 时 常常 遇 到 这 种 情况 。 同 样 ， 在 代码 中 应 该 使 用 d/ 








tempid 一 因为 #db/id 字画 

















会 不 同 ， 代 码 就 会 失效 ， 





因为 它 永远 














量 会 在 编译 时 求 值 一 次 ， 这 意味 着 如 果 预 期 ID 值 在 两 次 运行 时 
只 有 一 个 值 。 

















请 考虑 我 们 的 示例 文件 ，user-bootstrap.edn: 


[{:db/id #db/id [:db.part/user] 
:user/email "fowler@acm.org" 
:user/name "Martin Fowler" 
:user/roles [:user.roles/author :user.roles/editor]}] 





在 事务 完成 时 ， 你 会 收 到 一 个 完成 的 future 对象。 如 果 你 喜欢 异步 的 事务 ， 可 以 用 d/ 


transact-async 代替 ， 它 将 立即 返回 future 对 象 。 在 这 种 情况 下 ， 就 像 所 有 future 对 象 一 
样 ， 如 果 你 对 它 去 引用 (dereference)， 它 将 阻塞 直至 事务 完成 。 不 管 哪 种 方式 ， 对 future 


去 引用 将 返回 一 个 映射 表 ， 包 含 以 下 4 个 键 。 


:db-before 





在 事务 执行 之 前 数据 库 的 值 。 


:db-after 








在 事务 执行 之 后 数据 库 的 值 。 


:tx-data 


所 有 执行 事务 的 datom 构成 的 向 量 。 


:tempids 











临时 ID 到 数据 库 中 ID 的 映射 ， 事务 中 的 每 个 临时 ID 有 一 个 表 项 。 





在 事务 之 后 ， 可 以 用 :db-after 数据 库 来 直接 查询 该 数据 库 : 
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(def db-after-tx (:db-after tx-result)) 


(q '[:find ?name :in $ ?email :where 
[?entity :user/email ?email] 
[?entity :user/name ?name]] 

db-af ter -tx 
"fowler@acm.org") 
;; -> #{["Martin Fowler"]} 


对 于 你 关心 的 新 实体 ， 可 以 通过 :tempids 映射 表 找 到 数据 库 中 的 DD， 就 像 在 SQL 数据 库 


中 取得 最 后 插入 的 ID 一样。 调用 datomic.api/resolve-tempid 函数 ， 参 数 是 :db-after 的 
值 、:tempids 的 值 和 最 初 的 临时 ID ， 可 以 取得 实现 后 的 ID: 

















(d/resolve-tempid db-after-tx (:tempids tx-result) new-id) 
;; -> 17592186045421 


。 6.11 证 “为 Datomic 数据 库 定义 数据 模式 ”。 
。 6.13 节 “ 从 Datomic 数据 库 中 删除 数据 ”。 
。 6.14 节 “ 尝 试 Datomic 事务 而 不 提交 ”。 


6.13 从 Datomic 数 据 库 中 删除 数据 


作者 : Robert Stuttaford 








问题 

需要 从 Datomic 数据 库 中 删除 数据 。 

解决 方案 

要 删除 一 个 属性 的 值 ， 应 该 在 事务 中 使 用 :db/retract 操作 。 


要 继续 本 实例 ， 请 完成 6.10 节 “ 连 接 Datomic 数据 库 ” 和 6.11 节 “ 为 Datomic 数据 库 定义 
数据 模式 ”中 的 步骤 。 然 后， 你 就 有 了 连接 conn 和 数据 模式 ， 可 以 插入 数据 。 























开始 先 添加 一 个 用 户 Barney Rubble， 并 验证 他 有 email 地 址 : 
(def new-id (d/tempid :db.part/user)) 


(def tx-result @(d/transact conn 
[{:db/id new-id 
:User/name "Barney Rubble" 
:User/email "barney@example.com"}])) 





(def after-tx-db (:db-after tx-result)) 


(def barney-id (d/resolve-tempid after-tx-db 
(:tempids tx-result) 
new-id)) 


barney-id 
;; -> 17592186045429 


(d/q '[:find ?email :in $ ?entity-id :where 
[?entity-id :user/email ?email]] 
after-tx-db 
barney-id) 
;; -> #{["barney@rubble.me"]} 





要 撤销 Barney 的 email， 就 在 事务 中 执行 :db/retract 操作 : 


(def retract-tx-result @(d/transact conn [[:db/retract barney-id 
:user/email "barney@example.com"]])) 


(def after-retract-db (:db-after retract-tx-result)) 


(d/q '[:find ?email :in $ ?entity-id :where 
[?entity-id :user/email ?email]] 
after-retract-db 
barney-id) 
;; -> #{} 








要 撤销 整个 实体 ， 就 使 用 内 建 的 事务 管理 器 函数 :db.fn/retractEntity: 





(def retract-entity-tx-result 
@(d/transact conn [[:db.fn/retractEntity barney-id]])) 


(def after-retract-entity-db (:db-after retract-entity-tx-result)) 


(d/q '[:find ?entity-id :in $ ?name :where 
[?entity-id :user/name ?name]] 
after-retract-entity-db 
"Barney Rubble") 
;; -> #{} 


讨论 

在 使 用 :db/retract 时 ， 你 提供 要 撤销 的 值 ， 以 便 在 多 基数 属性 的 情况 下 ， 明 确 属性 的 
值 集合 中 要 撤销 哪个 值 。 不 论 基 数 如 何 ， 如 果 提 供 的 值 不 在 存储 器 中 ， 什 么 都 不 会 撤销 。 
这 意味 着 必须 知道 要 撤销 的 值 是 什么 ， 不 能 只 提供 实体 的 ID 和 属性 ， 就 撤销 该 属性 的 所 
有 值 。 


如 果 被 撤销 值 的 属性 没有 使 用 :db/noHistory， 你 就 能 够 查询 过 去 数据 库 的 值 ， 找 到 该 属 
性 过 去 的 值 。 






































Mm 
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如 果 被 撤销 值 的 属性 使 用 了 :db/noHistory， 数 据 就 被 永久 删除 了 。 

在 使 用 :db.fn/retractEntity 时 ， 该 实体 的 所 有 属性 的 所 有 值 都 会 被 撤销 ， 所 有 :db/ref 
属性 以 实体 作为 值 ， 也 会 被 撤销 。 撤 销 实体 的 所 有 组 件 实 体 ， 将 会 被 递归 撤销 。 

你 会 发 现 真正 的 实体 ID 本 身 没 有 被 撤销 ， 但 没有 任何 属性 与 它 关 联 。 这 是 因为 实体 一 旦 
创建 ， 它 就 不 能 撤销 。 但 是 ， 删 除 所 有 属性 以 及 对 该 实体 的 引用 ， 效 果 等 同 于 永久 地 删 
除 它 ! 























如 果 出 于 法 律 翘 虑 ， 或 者 面 对 的 数据 超出 了 领域 特定 的 保存 期 ， 因 此 需要 永久 地 删除 数 
据 ， 请 使 用 excision (http://blog.datomic.com/2013/05/excision.html) 永久 地 删除 数据 。 


参阅 

。 Datomic 博 客 文 章 (http://blog.datomic.com/2013/05/excision.html) 介 绍 了 excision 的 功能 。 
6.14 ”尝试 Datomic 事 务 而 不 提交 

作者 : Robert Stuttaford 

问题 

希望 在 使 用 Datalog 或 实体 API 提交 事务 之 前 ， 先 测试 事 
解决 方案 


像 平常 一 样 构建 事务 ， 但 不 是 调用 d/transact 或 d/transact-async， 而 是 用 d/with 得 到 
一 个 内 存 数据 库 ， 其 中 包含 事务 所 产生 的 变更 。 














0 
ey 














要 继续 本 实例 ， 请 完成 6.10 节 “ 连 接 Datomic 数据 库 ” 和 6.11 节 “ 为 Datomic 数据 库 定义 
数据 模式 ”中 的 步骤 。 然 后 ， 你 就 有 了 连接 conn 和 数据 模式 ， 可 以 插入 数据 。 


首先 ， 向 数据 库 中 添加 关于 Fred Flintstone 的 数据 。 由 于 是 在 公元 前 4000 年 左右 ，Fred 没 
有 email， 但 至 少 我 们 知道 他 的 姓名 : 











(require '[datomic.api :as d]) 
(def new-id (d/tempid :db.part/user)) 
(def tx-result @(d/transact conn 


[{:db/id new-id 
:USser/name "Fred Flintstone"}])) 





快速 跳 到 今天 : 在 冰 中 冻 了 6000 年 后 ，Fred 被 解冻 了 ， 他 有 了 自己 第 一 个 email 地址 。 准 
一 个 事务 ， 为 Fred 实体 添加 email: 




















;; 从 最 初 的 事务 中 取得 Fred 的 ID 

(def fred-id (d/resolve-tempid (:db-after tx-result) 
(:tempids tx-result) 
new-id)) 


fred-id 
;; -> 17592186045421 


(def add-freds-email-tx [[:db/add fred-id 
:user/email "twinkletoes@example.com"]]) 





现在 ,准备 一 个 内 存 数据 库 ， 执 行 新 事务 。 首 先 ， 取 得 当前 数据 库 的 值 作为 基础 ， 然 后 创 
建 内 存 数据 库 。 最 后 ， 取 得 :db-after 值 ， 这 样 就 可 以 测试 email 值 是 否 添加 正确 : 





























(defn db-with 
"Return a new database with tx applied" 
[db tx] 
(-> (d/with db tx) 
:db-after)) 


(def db-after (db-with (d/db conn) add-freds-email-tx)) 


比较 当前 数据 库 中 Fred 的 email 和 内 存 数 据 库 中 Fred 的 email: 





(defn users-email 
"Retrieve a user's email given the user's name." 


[db name] 

(-> (d/q '[:find ?email 
:in $ ?name 
:where 


[?entity :user/name ?name] 
[?entity :user/email ?email]] 
db 
name) 
ffirst)) 


(users-email db-after "Fred Flintstone") 
;; -> "twinkletoes@example.com" 


(users-email (d/db conn) "Fred Flintstone") 
;; -> nil 


可 以 看 到 ， 当 前 数据 库 没有 受到 这 个 事务 的 影响 ， 但 在 db-after 中 的 数据 库 现在 显示 出 
新 值 。 
讨论 


d/with 产生 的 数据 库 可 以 用 于 所 有 其 他 接受 数据 库 的 API 函数 ， 包 括 d/with 本 身 。 这 意 
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味 着 你 可 以 执行 一 次 又 一 次 的 事务 ， 而 不 必 将 它们 提交 给 事务 管理 器 1 


Datomic 如 此 强大 ， 有 一 点 是 因为 它 能 将 数据 库 作为 一 个 值 。 出 于 这 个 原因 ， 我 们 写 的 辅 
助 函 数 接受 数据 库 作 为 参数 ， 而 不 是 连接 。 现 在 ， 不 仅 可 以 查询 当前 的 数据 库 ， 而 且 也 可 
以 查询 该 数据 库 的 其 他 值 。 









































参阅 
。 6.12 节 “ 向 Datomic 写 入 数据 "， 了 解 关于 数据 事务 的 更 多 一 般 信 息 。 





6.15 遍历 Datomic 索 引 


作者 : Alan Busby 和 Ryan Neufeld 


立 


问 是 
快速 执行 简单 的 Datomic 查询 。 

解决 方案 

用 datomic.api/datoms 国 数 直 接 访 问 数据 库 中 的 核心 Datomic 索引 。 


要 继续 本 实例 ， 请 完成 6.10 节 “ 连 接 Datomic 数据 库 ” 和 6.11 节 “ 为 Datomic 数据 库 定义 
数据 模式 ”中 的 步骤 。 然 后， 你 就 有 了 连接 conn 和 数据 模式 ， 可 以 插入 数据 。 


婚 


希 














例如 ， 要 很 快 找到 有 指定 属性 和 值 集 的 实体 ， 就 调用 datomic.api/datoms， 指 定 :avet 索 
引 (属性 、 值 、 实 体 、 事 务 ) 以 及 期 望 的 属性 和 值 : 





(require '[datomic.api :as d]) 


(d/transact conn [{:db/id (d/tempid :db.part/user) 
:User/name "Barney Rubble" 
:User/email "barney@example.com"}]) 


(defn entities-with-attr-val 
"Return entities with a given attribute and value." 
[db attr vall] 
(->> (d/datoms db :avet attr val) 
(map :e) 
(map (partial d/entity db)))) 


(def barney (first (entities-with-attr-val (d/db conn) 
:User/email 
"barney@example.com"))) 





(:user/email barney) 
;; -> "barney@example.com" 


这 只 适用 于 :db/index 为 true 或 :db/unique 不 为 nil 的 属性 。 








要 快速 取得 实体 的 所 有 属性 ， 就 用 :eavt 排序 的 索引 : 


(defn entities-attrs 
"Return attrs of an entity" 
[db entity] 
(->> (d/datoms db :eavt (:db/id entity)) 
(map :a) 
(map (partial d/entity db)) 
(map :db/ident))) 


(entities-attrs (d/db conn) barney) 
;; -> (:Uuser/email :User/name) 


要 快速 找到 通过 :db.type/ref 来 引用 指定 实体 的 所 有 实体 ， 就 用 :vaet 排序 的 索引 : 


;; 添加 一 个 人 ， 引 用 :user.rotLes/author 角色 
(d/transact conn [{:db/id (d/tempid :db.part/user) 
:User/name "Ryan Neufeld" 
:User/emaiL "ryan@rkn.io" 
:user/roles [:user.roles/author :user.roles/editor]}]) 





(defn referring-to 
"Find all entities referring to an entity as a certain attribute." 
[db entity] 
(->> (d/datoms db :vaet (:db/id entity) ) 
(map :e) 
(map (partial d/entity db)))) 


(def author-entity (d/entity (d/db conn) :user.roles/author)) 
;; 具有 :user.roles/author 角色 的 所 有 用 户 的 姓名 


(map :user/name (referring-to (d/db conn) author-entity)) 
;; -> ("Ryan Neufeld") 


讨论 

对 于 简单 的 查找 查询 ， 如 “ 按 属性 查找 ”或 “ 按 值 查找 "， 在 性 能 上 没有 超过 Datomic 的 
原始 索引 的 。datomic.api/datoms 接口 提供 对 所 有 Datomic 索引 的 访问 ， 让 你 能 深入 任何 
层级 ， 找 出 正好 是 你 需要 的 数据 。 
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像 大 多 数 Datomic 函数 一 样 ，datoms 接受 db 作为 第 一 个 参数 。 在 我 们 的 例子 中 ， 以 及 本 
书 的 其 他 地 方 ， 你 都 会 注意 到 ， 我 们 也 接受 数据 库 作为 一 个 值 ， 而 不 是 一 个 连接 ， 因 为 这 
种 习惯 允许 API 用 户 对 同一 个 数据 库 值 执行 各 种 操作 。 你 应 该 自己 试 一 下 。 









































datons 的 第 二 个 参数 表明 要 访问 的 具体 索引 。 每 个 值 都 是 字母 e (实体 )、a (属性 )、v 
( 值 ) 和 t (事务 ) 的 不 同 排列 。 索 引 中 字母 的 次 序 表明 它 如 何 被 索引 。 例 如 ，:eavt 应 该 
按 实体 遍历 ， 然 后 是 属性 ， 以 此 类 推 。 四 种 索引 以 及 它们 包含 的 内 容 如 下 : 











:eavt 


包含 所 有 datom 的 、 实 体 为 先 的 索引 。 这 个 索引 提供 的 数据 库 视图 很 像 传统 的 关系 数 
据 库 。 








:aevt 
包含 所 有 datom 的 、 先 属性 后 实体 的 索引 。 这 个 索引 提供 数据 库 的 列 访问 ， 很 像 数 据 
仓库 。 








:avet 


属性 - 值 素 引 ， 只 包含 :db/index 为 true 的 属性 。 对 于 查找 索引 非常 有 用 (例如,“ 我 
需要 email 为 foo@example.com 的 实体 ”)。 

















:vaet 

值 优先 的 索引 ， 只 包含 :db.type/ref 的 值 。 这 是 非常 有 趣 的 索引 ， 可 以 让 数据 有 点 像 
图 数据 库 。 
在 指定 了 索引 次 序 后 ， 就 可 以 选择 提供 任意 个 组 件 来 预 遍历 该 索引 。 这 样 做 是 为 了 减少 返 
回 元 素 的 数目 。 例 如 ， 对 AVET 遍历 只 指定 属性 组 件 ， 将 返回 具有 那 种 属性 的 所 有 实体 。 
指定 属性 和 值 组 件 ， 将 只 返回 具有 指定 属性 / 值 对 的 实体 。 



































datoms 返回 的 是 一 个 Datum 对 象 流 。 每 个 Datum 对 象 都 作为 函数 响应 :a、:e、:t、:v 
和 :added 等 关键 字 。 


参阅 
。 6.12 节 “ 向 Datomic 写 入 数据 ”。 





第 7 章 


Web 应 用 





7.0 简介 


如 今 ，Web 应 用 开发 是 许多 编程 语言 的 谋生 手段 ，Clojure 也 不 例外 。 在 2013 年 度 Clojure 
现状 调查 (http://cemerick.com/2013/11/18/results-of-the-2013-state-of-clojure-clojurescript-sur 
vey/) 中 ， 对 于 “你 在 什么 领域 使 用 Clojure 或 ClojureScript ? ”这 样 的 问题 ，Web 开发 是 
排名 第 一 的 答案 。 





现在 许多 Clojure Web 开发 社区 都 以 Ring (https://github.com/ring-clojure/ring) 为 中 心 ， 它 
是 一 个 HTTP 服务 器 库 ， 很 像 Ruby 的 Rack (http:/rack.github.io/) 。 在 7.1 节 “Ring 简介 ” 
之 后 ， 我 们 提供 了 各 种 补充 实例 ， 让 你 能 很 快 实现 高 速 开发 。 








在 Ring 之 后 ， 本 章 介 绍 了 目前 可 用 的 其 他 Clojure Web 开发 生态 系统 ， 包 括 一 些 模板 和 
HTML 操作 库 ， 以 及 另 一 些 Web 框架 。 








7.1 Ring 简介 


作者 : Adam Bard 


问题 


需要 用 Clojure 编写 一 个 HTTP 服务 。 
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解决 方案 


Clojure 没有 内 建 的 HTTP 服务 器 ， 但 服务 基本 同步 HTTP 请 求 的 事实 标准 是 Ring 库 。 








要 继续 这 个 实例 ， 请 复制 https://github.com/clojure-cookbook/ringtest 代码 库 ， 并 履 写 src/ 


Tingtest.c]j : 





(ns ringtest 
(:require 
[ring.adapter.jetty :as jetty] 
clojure.pprint)) 





;; 返回 收 到 的 请 求 (经 过 美化 打印 ) 
(defn handler [request] 
{:status 200 
:headers {"content-type" "text/clojure"} 
:body (with-out-str (clojure.pprint/pprint request))}) 





bal 








(defn -main [] 
;; 在 端口 3006 运行 服务 器 
(jetty/run-jetty handler {:port 3000})) 


讨论 

Ring (https://github.com/ring-clojure/ring) 是 许多 Clojure Web 应 用 的 基础 。 它 提供 了 底层 
的 、 简 单 的 请 求 / 响 应 API， 其 中 请 求 和 响应 是 普通 的 Clojure 映射 表 。Ring 应 用 是 围绕 
“处 理 函 数 ” 建 立 的 : 这 些 函 数 接受 请 求 并 返回 响应 。 前 面 的 例子 定义 了 一 个 简单 的 处 班 
国 数 ， 只 是 把 收 到 的 请 求 返回 给 响应 。 




















二 


























[FT 








基本 的 响应 映射 表 包 含 三 个 键 : :status 是 返回 的 状态 码 ，:headers 是 可 选 的 “字符 
串 -字符 串 ” 映 射 表 ， 包 含 需要 的 响应 头 ，:body 是 字符 串 ， 包 含 需要 的 响应 体 。 这 
里 ，:status 是 200，:body 是 美化 打印 过 的 请 求 字符 串 。 因 此 ， 在 作者 的 机 器 上 访问 URL 
http://localhost:3000/test/path/?qs=1 得 到 了 下 面 的 响应 ， 展 示 了 请 求 的 结构 : 


{:ssl-client-cert nil, 
:remote-addr "0:0:0:0:0:0:0:1", 
:scheme :http, 
:request-method :get, 
:query-string "qs=1", 
:content-type nil, 
:uri "/test/path/", 
:server-name "localhost", 
:headers 
{"accept-encoding" "gzip,deflate,sdch", 
"connection" "keep-alive", 
"User-agent" 
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.36 
(KHTML, like Gecko) Chrome/28.0.1500.71 Safari/537.36", 
"accept-language" "en-US,en;q=0.8", 





"accept" 

"text/html ,application/xhtml+xml ,application/xml;q=0.9,*/*;q=0.8", 
"host" "localhost:3000", 

"cookie" ""}, 

:content-length nil, 

:Server-port 3000, 

:character-encoding nil, 

:body #<HttpInput org.eclipse.jetty.server.HttpInput@43efe432>} 


可 以 看 到 这 很 全 面 ， 但 是 很 底层 ， 请 求 中 突出 的 特点 解析 成 Clojure 数据 结构 ， 没 有 额外 
的 抽象 。 通 常会 利用 其 他 的 代码 或 库 ， 从 这 个 数据 结构 中 提取 有 意义 的 信息 。 

Jetty 用 于 运行 租 入 式 的 Jetty 服务 器 。Ring 也 带 有 适配器 ， 可 以 作为 servlet 运行 在 所 有 
Java servlet 容器 中 。 

请 注意 ， 调 用 run-jetty 是 同步 的 ， 只 要 服务 器 在 运行 ， 它 就 不 会 返回 。 如 果 从 REPL 中 
调用 ， 应 该 用 一 个 future 对 象 包装 它 (或 采用 其 他 并 发 机 制 )， 这 样 服务 器 就 会 运行 在 其 他 
线程 中 ，REPL 就 不 会 失去 响应 。 














参阅 
。 Ring 的 GitHub 代码 库 (https://github.com/ring-clojure/ring)。 


7.2 ”使 用 Ring 中 间 件 


作者 : Adam Bard 


问题 
希望 构建 一 个 转换 器 ， 自 动 应 用 于 Ring 的 请 求 或 响应 。 例 如 ，Ring 提供 一 些 请 求 字符 串 ， 
但 你 更 希望 处 理解 析 过 的 映射 表 。 


解决 方案 

因为 Ring 处 理 普通 的 Clojure 数据 和 函数 ， 可 以 简单 地 将 中 间 件 定义 为 返回 函数 的 函数 。 
在 这 里 ， 定 义 一 个 中 间 件 来 修改 请 求 ， 在 请 求 中 添加 解析 过 的 请 求 字符 串 ， 再 将 它 传递 给 
处 理 函 数 。 





















































要 继续 这 个 实例 ， 请 复制 https://github.com/clojure-cookbook/ringtest 代码 库 ， 并 覆 写 src/ 


Tingtest.c]j : 





(ns ringtest 
(:require 
[ring.adapter.jetty :as jetty] 
[clojure.string :as str] 
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clojure.pprint)) 


(defn parse-query-string 
"Parse a query string to a hash-map" 
[qs] 
(if (> (count qs) 9) ; 不 要 操作 nil 或 空 字符 串 
(appLy hash-map (str/split qs #"[8&=]")))) 


(defn wrap-query 

"Add a :query parameter to incoming requests that contains a parsed 
version of the query string as a hash-map" 

[handler] 

(fn [req] 

(let [parsed-qs (parse-query-string (:query-string req)) 
new-req (assoc req :query parsed-qs)] 
(handler new-req)))) 


(defn handler [req] 
(Let [name (get (:query req) "name")] 
{:status 200 
:body (str "Hello, " (or name "World"))})) 


(defn -main [] 
;; 在 端口 3999 运行 服务 器 
(jetty/run-jetty (wrap-query handler) {:port 3000})) 


讨论 
因为 Ring 处 理 函数 操作 普通 的 Clojure 映射 表 ， 所 以 很 容易 写 一 个 中 间 件 来 包装 处 理 函 
数 。 这 里 ， 我 们 写 了 一 个 中 间 件 来 修改 请 求 ， 再 将 它 传递 给 处 理 函 数 。 如 有 果 原 始 请 求 像 


这 样 : 














{:query-string "x=1&y=2" 
; ... and the rest 


那么 处 理 函 数 收 到 的 请 求 就 变 成 : 





{:query-string "x=1&y=2" 
:query {"x" i "y" "2"} 
; ... and the rest 


} 


不 过 ， 你 不 需要 为 此 编写 自己 的 中 间 件 。Ring 提供 了 一 些 中 间 件 让 你 加 到 应 用 中 ， 其 中 包 
括 名 为 wrap-params 的 中 间 件 ， 它 做 的 事 和 我 们 刚才 写 的 中 间 件 一 样 ， 但 更 好 。 根 据 Ring 


的 文档 (http://clojuredocs.org/ring/ring.middleware.params/wrap-params) : 
































wrap-params 


中 间 件 是 指 从 请 求 字符 串 和 表单 (如 果 请 求 是 url 编码 的 表单 ) 中 解析 出 url 编码 
的 参数 。 它 向 请 求 映射 表 中 添加 以 下 键 。 
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:query-params: 映射 表 ， 包 含 来 自 查询 字符 串 的 参数 ; 

:form-params: 映射 表 ， 包 含 来 自 请 求 体 的 参数 ; 

:params: 所 有 类 型 参数 合并 后 的 映射 表 。 

它 接 受 可 选 的 配置 映射 表 。 识 别 的 键 包括 : 

:encoding: url 解码 时 用 的 编码 方式 。 如 果 不 指定 ， 就 用 请 求 字 符 的 编码 ， 在 没 设 
置 请 求 字 符 编 码 时 用 “UTF-8”。 











没有 只 能 使 用 一 个 中 间 件 的 限制 。 通 常 ， 你 至 少 会 用 到 cookie、 会 话 和 参数 中 间 件 。 有 一 
种 简洁 的 方式 在 处 ee 即使 用 -> 宏 























(require '[ring.middleware.session :refer [wrap-session]]) 
(require '[ring.middleware.cookies :refer [wrap-cookies]]) 
(require '[ring.middleware.params :refer [wrap-params]]) 
(def wrapped-handler 
(-> handler 

wrap-cookies 

wrap-params 

wrap-session)) 


sh 
En 


。 Ring 的 中 间 件 概念 文档 (https://github.com/ring-clojure/ring/wiki/Concepts#middleware)。 


7.3 用 Ring 提 供 静 态 文件 


作者 : Clinton Dreisbach 


希望 通过 Ring 应 用 提供 静态 文件 。 
解决 方案 
使 用 ring.middleware.file/wrap-file: 


(require '[ring.middleware.file :refer [wrap-file]]) 


;; 提供 公有 目录 下 的 所 有 文件 
(def app 
(wrap-file handler "/var/webapps/public")) 





讨论 
wrap-file 包装 了 另 一 个 Web 请 求 处 理 函数 ， 如 果 静态 文件 在 指定 的 目录 下 存在 ， 就 提供 
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该 文件 ， 否 则 就 调用 该 处 理 函 数 。 


wrap-fite 只 是 提供 静态 文件 的 一 种 方式 。 如 果 只 想 提供 某 一 个 文件 ，ring.util. 
response/file-response 将 返回 一 个 处 理 函 数 ， 提 供 该 文件 : 








(require '[ring.util.response :refer [file-response]]) 


;; 提供 README.html 
(file-response "README.html") 


;; 提供 pubLic/ 目录 下 的 README.html 
(file-response "README.html" {:root "public"}) 





;; 通过 符号 连接 提供 README.html 
(file-response "README.html" {:allow-symlinks? true}) 





你 常常 希望 将 静态 文件 与 应 用 捆绑 在 一 起 。 在 这 种 情况 下 ， 通 过 classpath 而 不 是 指定 目录 
来 提供 文件 就 更 有 意义 。 要 做 到 这 一 点 ， 就 用 ring.middleware.resource/wrap-resource: 











(require '[ring.middleware.resource :refer [wrap-resource]]) 


(def app 
(wrap-resource handler "static")) 











这 将 提供 classpath 中 名 为 static 目录 下 的 所 有 文件 。 在 Leiningen 项 目 中 ， 可 以 将 static 目 
录放 在 resources/ 目录 下 ， 让 静态 文件 和 项 目 生 成 的 JAR 文件 打包 在 一 起 。 




















也 许 你 希望 用 ring.middleware.file-info/wrap-file-info 包装 所 有 的 文件 啊 应 。 这 个 
Ring 中 间 件 检查 文件 的 修改 日 期 和 类 型 ， 设 置 响应 头 中 的 Content-Type 和 Last-Modified。 
wrap-file-info 需要 包装 wrap-fitLe 或 wrap-resource。 





参阅 
。 4.4 市 “访问 资源 文件 ”。 
。 7.8 节 “ 用 Compojure 路 由 请 求 ”。 


7.4 用 Ring 处 理 表单 数据 


作者 : Adam Bard 








希望 应 用 能 接受 用 户 的 HTML 表单 输入 。 








解决 方案 
利用 ring.middleware.params/wrap-params， 将 传人 的 HTTP 表单 参数 添加 到 传人 的 请 求 映 
射 表 中 。 


要 继续 这 个 实例 ， 请 复制 https://github.com/clojure-cookbook/ringtest 代码 库 ， 并 覆 写 src/ 


ringtest.c]j : 








(ns ringtest 
(:require 
[ring.adapter.jetty :as jetty] 
[ring.middleware.params :refer [wrap-params]])) 


(def greeting-form 
(str 
"<html>" 
" <form action='' method='post'>" 
Enter your name: <input type='text' name='name'><br/>" 
<input type='submit' value='Say Hello'>" 
</form>" 
"</html>")) 


(defn show-form [] 
{:body greeting-form 
:status 200 }) 


(defn show-name 
"A response showing that we know the user's name" 
[name] 
{:body (str "Hello, " name) 
:status 200}) 


(defn handler 
"Show a form requesting the user's name, or greet them if they 
submitted the form" 
[req] 
(let [name (get-in req [:params "name"])] 
(if name 
(show-name name) 
(show-form)))) 


(defn -main [] 
;; 在 端口 3999 运行 服务 器 
(jetty/run-jetty (wrap-params handler) {:port 3000})) 








讨论 
wrap-parans 是 一 个 Ring 中 间 件 ， 它 负责 从 原始 请 求 中 提取 查询 字符 串 和 表 这 
请 求 中 添加 三 个 键 。 


Wp 
其 
中 
Ely 
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:query-params 


包含 解析 过 的 查询 字符 串 参 数 的 映射 表 。 


:form-params 


包含 表单 体 参 数 的 映射 表 。 





:params 


包含 :query-params 和 :form-params 合并 后 的 内 容 。 








在 前 面 的 例子 中 ， 我 们 使 用 了 :form-params， 所 以 处 理 函 数 只 响应 POST 请 求 ， 而 且 此 请 
求 包含 以 表单 形式 编码 的 参数 。 如 果 我 们 用 的 是 :params ， 就 可 以 选择 用 URL 查询 字符 串 
带 上 "name" 参数 。:params 适用 于 所 有 参数 (表单 形式 或 URL 编码 形式 )。:form-params 
只 适合 表单 参数 。 


请 注意 ， 表 单 键 被 作为 字符 串 传人， 而 不 是 关键 字 。 


























。 7.2 节 “ 使 用 Ring 中 间 件 ”。 
。 Ring 的 参数 文档 (https://github.com/ring-clojure/ring/wiki/Parameters) 。 





7.5 用 Ring 处 理 Cookie 


作者 : Adam Bard 


问题 
你 的 Web 应 用 需要 读 取 或 设置 用 户 浏 览 器 的 cookie (例如 ， 为 了 记 住 用 户 的 姓名 )。 


解决 方案 


用 ring.middleware.cookies/wrap-cookies 中 间 件 ， 在 请 求 中 添加 cookie。 








要 继续 这 个 实例 ， 请 复制 https://github.com/clojure-cookbook/ringtest 代码 库 


ringtest.clj: 


并 履 写 Src/ 








(ns ringtest 
(:require 
[ring.adapter.jetty :as jetty] 
[ring.middleware.cookies :refer [wrap-cookies]] 
[ring.middleware.params :refer [wrap-params]])) 


(defn set-name-form 





"A _ response showing a form for the user to enter their name." 
[] 
{:body "<htmL> 
<form action=''> 
Name: <input type='text' name='name'> 
<input type='submit'> 
</form> 
</html>" 
:Status 200 
:content-type "text/html"}) 


(defn show-name 
"A response showing that we know the user's name" 
[name] 
{:body (str "Hello, " name) 
:cookies {f"name" {:value name}} ; 保存 cookie 
:status 200 }) 


(defn handler 
"If we know the user's name, show it; else, show a form to get it." 
[req] 
(let [name (or 
(get-in req [:cookies "name" :value]) 
(get-in req [:params "name"]))] 
(if name 
(show-name name) 
(set-name-form)))) 


(def wrapped-handler 
(-> handler 
wrap-cookies 
wrap-params)) 


(defn -main [] 
;; 在 端口 3066 运行 服务 器 
(jetty/run-jetty wrapped-handler {:port 3000})) 


讨论 
这 个 例子 使 用 了 ring-core 中 包含 的 wrap-cookies 和 wrap-params 中 间 件 。 用 户 第 一 次 访 


问 一 个 页 面 时 ， 它 显示 一 个 表单 ， 让 他 们 输入 姓名 。 一 旦 输入 过 ， 它 就 将 用 户 的 姓名 保存 
在 一 个 cookie 中 ， 并 显示 它们 ， 直 到 该 cookie 被 删除 为 止 。 











这 个 例子 利用 wrap-cookies， 从 cookie 映射 表 中 取得 用 户 保存 的 姓名 ， 如 果 没 有 ， 就 利用 
wrap-params， 从 请 求 参数 中 取得 用 户 的 姓名 。 





Ring 的 cookie 中 间 件 只 在 传 入 的 请 求 映 射 表 中 ,添加 了 一 个 额外 的 参数 :cookies， 并 将 响 
应 中 传 出 的 cookie 设置 为 cookies 参数 。 映 射 表 中 的 :cookies 参数 看 起 来 像 这 样 : 
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"name" {:valuyue "Some Guy"}} 














你 可 以 为 每 个 cookie 添加 其 他 可 选 的 参数 ， 和 :value 放 在 一 起 。Ring cookie 文档 (https:// 


github.com/ring-clojure/ring/wiki/Cookies) 中 说 。 
在 设置 cookie 值 的 同时 ， 你 也 可 以 设置 其 他 属 


。 :domain 一 限制 cookie 仅 用 于 特定 的 域名 。 
。 :path 一 限制 cookie 仅 用 于 特定 的 路 径 。 
。 :secure 一 如 果 为 真 ， 限 制 cookie 仅 用 于 HTTPS URL。 


生 。 











。 :http-only 一 如 果 为 真 ， 限 制 cookie 仅 用 于 HTTP (比如 不 能 通过 JavaScript 访问 )。 





。 :max-age 一 cookie 过 期 的 秒 数 。 
。 :expires 一 cookie 过 期 的 指定 日 期 和 时 间 。 





sh 
En 


。 7.2 市 “使 用 Ring 中 间 件 ”。 
。 Ring 的 cookie 文档 (https://github.com/ring-clojure/ring/wiki/Cookies)。 


7.6 用 Ring 保 存 会 话 


作者 : Adam Bard 


问题 
需要 保存 登录 用 户 的 一 些 安全 数据 ， 作 为 服务 器 端的 状态 。 


解决 方案 


用 ring.middleware.session/wrap-session， 在 Ring 应 用 中 添加 会 话 。 








要 继续 这 个 实例 ， 请 复制 https://github.com/clojure-cookbook/ringtest 代码 库 


Tingtest.c]j : 





(ns ringtest 
(:require 
[ring.adapter.jetty :as jetty] 
[ring.middleware.session :refer [wrap-session]] 
[ring.middleware.params :refer [wrap-params]])) 


(def login-form 


1 得 : 环 


<form action='' method='post'> 


9》 


、 


才 


F 覆 写 Src/ 
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如 
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"</htmL>' 


<input type='submit' value='Log In'> 
</form>" 


Username: <input type='text' name='username'><br/>" 
Password: <input type='text' name='password'><br/>" 


)) 


(defn show-form [] 
{:body login-form 
:status 200 }) 


(defn show-name 
"A response showing that we know the user's name" 
[name session] 
{:body (str "Hello, " name) 
:status 200 
:session session }) 


(defn do-login 


"Check the 


submitted form data and update the session if necessary" 


[params session] 
(if (and (= (params "username") "jim") 
(= (params "password") "password")) 
(assoc session :user "jim") 
session)) 


(defn handler 
"Log a user in, or not" 
[{session :session params :form-params :as req}] 
(let [session (do-login params session) 
Username (:user session)] 


(if username 
(show-name username session) 
(show-form)))) 


(def wrapped-handler 
(-> handler 
wrap-session 


wrap-params)) 


(defn -main [] 
;; 在 端口 3999 运行 服务 器 
(jetty/run-jetty wrapped-handler {:port 3000})) 





讨论 


Ring 的 会 话 中 间 伯 


似 的 API。 你 从 :session 请 求 映射 表 中 取得 会 话 数据 ， 在 响应 映射 表 中 加 入 :session 键 





下 





EF (https://github.com/ring-clojure/ring/wiki/Sessions) 具有 和 cookie API 类 








来 设置 它 。 在 :session 中 写 些 什么 取决 于 你 ， 但 通常 会 用 一 个 映射 表 来 保存 一 些 键 和 值 。 





在 背后 ，Ring 将 设置 名 为 ring-session 的 cookie， 它 包含 一 个 标识 会 话 的 唯一 下。 在 请 
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求 到 达 时 ， 会 话 中 间 件 从 请 求 中 取得 会 话 ID ， 然 后 从 某 个 会 话 存储 库 中 读 取 会 话 的 值 。 


中 间 件 使 用 哪个 会 话 存储 库 是 可 以 配置 的 。 默 认 是 使 用 内 存 中 的 会 话 存储 库 ， 这 对 于 开发 
很 有 用 ， 但 副作用 是 重启 应 用 时 会 丢失 会 话 。Ring 还 包括 一 个 加 密 的 cookie 存储 库 ， 它 
是 持久 的 。 你 还 可 以 得 到 针对 许多 流行 存储 库 编写 的 第 三 方 库 ， 包 括 Memcached (https:// 
github.com/killme2008/ring-session-memcached) 和 Redis (https://github.com/wuzhe/clj-redis- 
session) 。 你 也 可 以 编写 自己 的 代码 ， 将 会 话 保存 在 任何 数据 库 中 。 


向 wrap-session 传人 一 个 选项 映射 表 ， 其 中 包含 :store 参数 ， 可 以 设置 自己 的 存储 库 : 


























(wrap-session handler {:store (my-store)})) 





要 设置 :session 的 值 ， 只 要 将 它 和 响应 一 起 传 出 。 如 果 不 需要 改变 会 话 ， 就 不 要 在 响应 中 
带 上 :session。 如 果 确 实 想 清除 会 话 ， 就 将 :session 键 的 值 设置 为 nil。 


























sh 


阅 
7.2 市 “使 用 Ring 中 间 件 ”。 
。 Ring 的 会 话 文档 (https://github.com/ring-clojure/ring/wiki/Sessions)。 


7.7 在 Ring 中 读 写 请 求 和 响应 的 头 


作者 : Luke VanderHart 和 Adam Bard 





问题 
需要 读 写 HTTP 请 求 和 响应 的 头 。 
解决 方案 


从 Ring 请 求 映 射 表 中 读 取 :headers 键 ， 或 在 Ring 处 理 函 数 返回 之 前 ， 利 用 assoc 将 值 关 
联 到 响应 映射 表 中 。 


要 继续 这 个 实例 ， 请 复制 https://github.com/clojure-cookbook/ringtest 代码 库 


ringtest.clj: 





» 


并 窗 写 Src/ 








(ns ringtest 
(:require 
[ring.adapter.jetty :as jetty])) 


(defn user-agent-as-json 
"A handler that returns the User-Agent header as a JSON 
response with an appropriate Content-Type" 
[req] 





A 
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{:body (str "{\"user-agent\": \"" (get-in req [:headers "user-agent"]) "\"}") 
:headers {"Content-Type" "application/json"} 
:status 200}) 


(defn -main [] 
;; 在 端口 3999 运行 服务 器 
(jetty/run-jetty user-agent-as-json {:port 3000})) 


讨论 
这 个 例子 定义 了 一 个 Ring 处 理 函 数 ， 它 将 请 求 中 的 User-Agent 头 以 JSON 格式 写 入 响应 。 


它 从 请 求 头 映射 表 中 取得 User-Agent， 利 用 响应 中 的 Content-Type 头 来 告诉 客户 端 ， 响 应 
应 该 解析 为 JSON。 


Ring 将 请 求 头 作为 请 求 映 射 表 中 的 :headers 参数 传 入 ， 也 接受 响应 上 映射 表 中 的 :headers 
参数 。 头 映射 表 中 的 键 和 值 都 应 该 是 字符 串 。Clojure 关键 字 是 不 支持 的 。 





























可 以 利用 Ring 来 设计 所 有 HTTP (http://en.wikipedia.org/wiki/List_of_HTTP_header_fields) 
中 合法 的 头 。 





根据 RFC-2616 (http:/www.w3.org/Protocols/rfc2616/fc 2616.html)， 头 的 名 称 不 区 分 大 小 
写 。 为 了 更 容易 一 致 地 用 get 取得 请 求 映射 表 中 的 值 ， 不 论 大 小 写 如 何 ，Ring 都 以 小 写 传 
入 所 有 头 的 值 ， 也 不 论 来 自 什 么 客户 端 。 但 是 ， 你 可 能 希望 在 发 送 头 时 使 用 规范 的 大 小 写 ， 
以 防 面 对 的 客户 端 不 兼容 (遵循 经 典 的 健壮 性 原则 :“ 对 发 送 的 保守 ， 对 接收 的 开放 ”) 。 












































参阅 
。 Ring 的 概念 文档 (https:Wgithub.com/ring-clojure/ring/wiki/Concepts ) 。 


7.8 用 Compojure 路 由 请 求 


作者 : Adam Bard 


问题 
需要 一 种 简单 的 方式 将 URL 路 由 到 特定 的 Ring 处 理 函 数 。 


解决 方案 


用 Compojure 库 (https://github.com/weavejester/compojure) 为 应 用 添加 路 由 。 


























要 继续 这 个 实例 ， 请 复制 https://github.com/clojure-cookbook/ringtest 代码 库 ， 并 覆 写 src/ 


Tingtest.c]j : 
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(ns ringtest 
(:require 


[compojure.core :refer [defroutes GET]] 


[ring.adapter.jetty :as 


;; 一 些 视图 函数 
(defn view [x] 
(str "<h1i>" x "</h1>")) 


(defn index [] 
(view "Hello")) 


(defn index-fr [] 
(view "Bonjour")) 


;; 路 由 


(defroutes main-routes 


jetty])) 


"/:greeting/" [greeting] (view greeting))) 


(GET "/" [] (index)) 
(GET "/en/" [] (index)) 
(GET "/fr/" [] (index-fr)) 
(GET 

;; 服务 器 


(defn -main [] 


(jetty/run-jetty main-routes {:port 3000})) 


讨论 





Compojure 是 一 个 路 由 库 ， 让 你 在 
宏 生 成 一 个 Ring 处 理 函 数 。 


这 里 ， 我 们 定义 了 四 个 路 由 : 
/ 
显示 "Hello" ; 
/en/ 
也 显示 "Hello" ; 
/fr/ 
显示 "Bonjour" ; 


/:greeting/ 
回 显 用 户 传人 的 问候 。 


E 应 用 中 定义 路 由 。 它 是 通过 defroutes 宏 来 完成 的 ， 该 


最 后 一 个 视图 是 Compojure URL 参数 语法 的 例子 。URL 中 由 :greeting 标识 的 部 分 被 传递 





给 视图 ， 视 


中 显示 “Buenos Dias”。 


图 将 它 显示 给 用 户 。 所 以 ， 访 问 http:Wlocalhost:3000/Buenos%20Dias/ 将 在 响应 
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有 一 点 需要 注意 ，Compojure 路 由 对 于 末尾 的 斜 杠 是 敏感 的 : 定义 为 /users/:user/blog/ 
的 路 由 不 会 匹配 URL http://mysite.com/users/fred/blog， 而 是 匹配 http://mysite.com/users/ 
fred/blog/。 














每 个 路 由 中 的 [实际 上 是 语法 糖 ， 用 于 截获 这 些 参数 。 也 可 以 用 req 或 其 他 任何 符号 来 取 
得 完整 的 请 求 : 





(defroutes main-routes-2 
(GET "/" req (some-view req))) 

















你 甚至 可 以 用 Clojure 的 解构 语法 ', 提取 请 求 中 的 部 分 。 例 如 ,如 果 使 用 wrap-params 中 间 
件 ， 就 可 以 抓 取 参数 并 将 它们 传递 给 一 个 函数 : 





(defroutes main-routes-2 
(GET "/" {params :params} (some-other-view params))) 


重要 的 是 要 意识 到 ，Compojure 是 基于 Ring 的 。 你 的 视图 仍然 应 该 返回 Ring 的 响应 映射 
表 (尽管 Compojure 会 对 基本 的 200 响应 返回 的 东西 进行 包装 ) 。 


























也 可 以 为 其 他 类 型 的 HITP 请 求 定 义 路 由 ， 只 要 用 相关 的 Compojure 指令 来 指定 : 除了 


compojure.core/GET，compojure.core/P0ST 和 compojure.core/PUT 也 是 最 常用 的 。 





Compojure 还 提供 了 其 他 一 些 有 用 的 工具 ， 如 compojure.route (http://weavejester.github. 
io/compojure/compojure.route.html) ， 包 含 了 辅助 函数 来 提供 资源 、 文 件 和 404 响应 ， 又 如 
compojure.handler (http://weavejester. github.io/compojure/compojure.handler.html) ， 将 一 些 
Ring 中 间 件 打包 成 一 个 方便 的 包装 函数 。 

参阅 

。 Compojure 的 网 站 (http://compojure.org/)。 


7.9 用 Ring 执 行 HTTP 重 定向 


作者 : Craig McDaniel 


问题 
在 Ring 应 用 中 ， 和 希望 返回 HTTP 响应 码 ， 将 浏览 器 重 定向 到 另 一 个 URL。 




















注 1: 如 果 你 不 熟悉 Clojure 的 解构 语法 ， 建 议 阅 读 Jay Fields 的 “Clojure: Destructuring” 博 客 文章 (http:/ 
blog.jayfields.com/2010/07/clojure-destructuring.html)。 更 多 的 资源 ， 请 阅读 Clojure Programming (http:// 
www.clojurebook.com/, O”Reilly) ， 作 者 是 Chas Emerick、Brian Carper 和 Christophe Grand。 该 书 深 入 


介绍 了 解构 。 
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解决 方案 


要 重 定向 Ring 请 求 ， 可 以 使 用 ring.util.response 命名 空间 的 redirect 函数 。 


要 继续 这 个 实例 ， 请 复 
ringtest.c]j : 


(ns ringtest 
(:require 


制 https://github.com/clojure-cookbook/ringtest 代码 库 ， 并 覆 写 src/ 








[ring.adapter.jetty :as jetty] 
[ring.util.response :as response])) 


(defn redirect-to-github 
"A handler that redirects aLL requests" 


[req] 


(response/redirect "http://github.com/")) 


(defn -main [] 








;; 在 端口 3660 运行 服务 器 
(jetty/run-jetty redirect-to-github {:port 3000})) 


讨论 
ring.util.response 命名 
表 中 动态 生成 (利用 来 自 
一 个 响应 映射 表 ， 包 含 


根据 HTTP 规范 ， 如 果 m 


空间 包含 了 一 个 重 定向 URL 的 函数 。 i URL 可 以 从 请 求 映 射 
wrap-params 的 参数 、 请 求 头等 )。 在 背后 ， 这 个 函数 只 是 创建 了 


:status 值 为 302 以 及 一 个 位 置 头 ， i URL。 





向 应 方法 是 POST、PUT 或 DELETE， 就 应 该 假定 服务 器 接受 了 


请 求 ， 客 户 端 应 该 向 位 置 头 中 的 URL 发 起 GET 请 求 。 在 编写 REST 服务 时 ， 这 是 一 项 


重要 的 警告 。 幸 和 运 的 是 ， 





新 的 位 置 ， 并 使 用 原来 的 方法 和 请 求 体 。 要 做 到 这 一 点 ， 只 要 在 处 理 函 数 中 像 这 样 返 


响应 映射 表 : 


(defn redirect-to-g 


[req] 
{:status 307 


规范 提供 了 307 状态 码 ， 








ithub 


:headers {"Location" "http://github.com"} 


:body ""}) 


阅 


。 Ring 的 概念 文档 (https://github.com/ring-clojure/ring/wiki/Concepts) 。 


7.10 用 Liberator 构 建 REST 风 格 的 应 用 


作者 : Eric Normand 





问题 
希望 基于 Ring 和 Compojure， 在 较 高 的 抽象 层 上 构建 RE 
Web 应 用 » 即 定义 资源 。 


解决 方案 








ST 风格 (符合 RFC 2616) 的 


使 用 Liberator (https://github.com/clojure-liberator/liberator) 来 创建 符合 HTTP 的 、REST 风 


格 的 Web 应 用 。 





要 继续 这 个 实例 ， 请 用 Lein new liberator-test 命令 创建 一 个 新 项 目 。 





[compojure "1.0.2"] 
[ring/ring-jetty-adapter "1.1.0"] 
[liberator "0.9.0"] 














然后 将 src/liberator_test/core.clj 修改 成 下 面 的 内 容 : 


(ns liberator-test.core 
(:require [compojure.core :refer [defroutes ANY]] 
[ring.adapter.jetty :as jetty] 
[liberator.core :refer [defresource]])) 


;; 资源 


(defresource root 
:available-media-types #{"text/plain"}) 


;; 路 由 
(defroutes main-routes 
(ANY "/" [] root)) 


;; 服务 器 


(defn -main [] 
(jetty/run-jetty main-routes {:port 3000})) 


讨论 





在 project.clj 中 ， 将 下 面 的 依赖 关系 添加 到 :dependencies 键 : 


Liberator (https://github.com/clojure-liberator/liberator) 是 一 个 库 ， 用 于 开发 符合 HTTP 的 
Web 服务 器 。 它 处 理 REST 风格 资源 的 内 容 交 互 、 状 态 码 和 标准 请 求 方法 。 它 利用 一 棵 符 


合 HTTP 规范 的 决策 树 来 决定 响应 的 状态 码 。 
Liberator 不 处 理 路 由 ， 所 以 需要 用 另 一 个 库 。 这 个 实例 使 月 
































月 了 Compojure。 由 于 Liberator 





在 处 理 请 求 方法 (GET、PUT、POST 等 ) 时 更 好 ， 所 以 应 该 在 Compojure 路 由 中 使 用 


ANY。 也 可 以 用 不 同 的 路 由 库 ， 如 Clout (https:Wgithub.com/weavejesterclout) 、Moustache 
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(https:/github.comy/cgrand/moustache) 或 playnice (https://github.com/ericnormand/playnice) router。 

















defresource 格式 定义 了 一 个 Web 资源 ， 它 被 建 模 为 一 个 Ring 处 理 函 数 。 然 后 你 可 以 将 该 
资源 作为 最 后 的 参数 ， 传 递 给 Compojure 路 由 。 


Liberator 资源 建立 时 具有 合理 的 默认 值 。 可 用 媒质 类 型 的 默认 值 是 空 集 ， 所 以 需要 设置 。 
否则 ，Liberator 将 返回 406“Not Acceptable” 的 响应 。 在 这 个 实例 中 ， 它 被 设置 为 响应 时 
带 有 text/plain 的 MIME 类 型 。 默 认 的 响应 是 “OK "”， 如 果 你 运行 本 实例 ， 并 用 训 览 器 访 
问 http:/localhost:3000， 就 会 看 见 。 














参阅 

。 7.1 节 “Ring 简介 ”， 了 解 关于 设置 Ring 的 更 多 信息 。 

。 7.8 节 “ 用 Compojure 路 由 请 求 "， 了 解 关 于 Compojure 路 由 的 更 多 信息 。 
。 Liberator 的 主页 (http://clojure-liberator.github.io/liberator/) 。 


7.11 用 Enlive 实 现 HTML 模 板 


作者 : Luke VanderHart 





希望 基于 模板 动态 地 创建 HTML， 不 用 传统 的 混合 代码 ， 或 DSL 风格 的 模板 。 


二 
解决 方案 

使 用 Enlive (https://github.com/cgrand/enlive)， 它 是 一 个 Clojure 库 
式 来 实现 HTML 模板 。 





采用 基于 选择 器 的 方 





不 像 PHP、ERB 和 JSP 等 其 他 模板 框架 ， 它 不 混合 代码 和 文本 。 不 像 Haml 或 Hiccup 这 样 
的 系统 ， 它 不 使 用 特殊 的 DSL。 相 反 ， 模 板 是 普通 的 HTML 文件 ，Enlive 利用 Clojure 代 
码 来 定位 具体 的 区 域 ， 并 用 传人 的 数据 实现 替代 或 复制 。 





要 继续 本 实例 ， 请 用 lein-try 启动 REPL : 
$ lein try enlive 


开始 ， 创 建 post.html 文件 ， 作 为 Enlive 模板 





<htmL> 
<head><title>Page Title</title></head> 
<body> 
<h1>Page TiLtLe</h1> 





-A 
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<h3>By <span class="author">Mickey Mouse</span></h3> 
<div class="post-body"> 
Lorem ipsum etc... 
</div> 
</body> 
</html> 


如 果 你 准备 在 项 目 中 使 用 Enlive， 就 将 这 个 文件 放 在 resources/ 目录 中 。 





下 面 的 Clojure 代码 根据 post.html 的 内 容 ， 定 义 了 一 个 Enlive 模板 : 
(require '[net.cgrand.enlive-html :as html]) 


;; 定义 模板 

(html/def template post-page "post.html" 
[post] 
[:title] (html/content (:title post)) 
[:h1] (html/content (:title post)) 
[:span.author] (html/content (:author post)) 
[:div.post-body] (html/content (:body post))) 


;; 一 些 示例 数据 
(def sample-post {:author "Luke VanderHart" 
:title "Why Clojure Rocks" 
:body "Functional programming!"}) 


要 对 数据 应 用 该 模板 ， 就 调用 deftemplate 定义 的 函数 。 因 为 它 返 回 一 个 字符 串 序 列 ， 所 
以 在 大 多 数 应 用 中 ， 你 会 希望 将 结果 连接 成 一 个 字符 串 : 








(reduce str (post-page sample-post)) 
下 面 是 格式 化 的 输出 : 


<html> 
<head><title>Why Clojure Rocks</title></head> 
<body> 
<h1>Why Clojure Rocks</h1> 
<h3>By <span class="author">Luke VanderHart</span></h3> 
</h3><div class="post-body">Functional programming!</div> 
</body> 
</htmL> 


关于 deftemplate 宏 的 详细 解释 ， 以 及 这 段 代码 究 竟 做 了 些 什么 ， 请 参见 后 面 的 讨论 小 节 。 


重复 元 素 
前 面 的 代码 只 是 在 输出 的 HTML 中 ， 取 代 了 特定 市 点 的 值 。 在 真实 的 场景 中 ， 男 一 个 常见 
的 任务 是 重复 输入 的 HTML 中 的 某 些 项 ， 每 次 重复 都 展示 一 项 输入 数据 。 对 于 这 个 任务 ， 
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Enlive 提供 了 片断 (snippet)， 它 是 输入 的 HTML 的 节选 ， 可 以 在 另 一 个 模板 的 输出 中 被 
重复 任意 次 : 


(def sample-post-list 

[{:author "Luke VanderHart" 
:title "Why Clojure Rocks" 
:body "Functional programming!"} 

{:author "Ryan Neufeld" 
:title "Clojure Community Management" 
:body "Programmers are like..."} 

{:author "Rich Hickey" 
:title "Programming" 
:body "You're doing it completely wrong."}]) 


(html/defsnippet post-snippet "post.html" 
{[:h1i] [[:div.post-body (html/nth-of-type 1)]]} 
[post] 
[:h1] (html/content (:title post)) 
[:span.author] (html/content (:author post)) 
[:div.post-body] (html/content (:body post))) 


(html/deftemplate all-posts-page "post.html" 
[post-List] 
[ :tttLe] (html/content "ALL Posts") 
[:body] (htmL/content (map post-snippet post-list))) 














调用 定义 的 aLL-posts-page 函数 将 得 到 一 个 HTML 页 面 ， 其 中 填充 了 全 部 三 个 海报 : 














(reduce str (all-posts-page sample-post-list)) 





下 面 是 格式 化 后 的 输出 : 











<htmL> 
<head><title>All Posts</title></head> 
<body> 
<hi>why Clojure Rocks</h1> 
<h3>By <span class="author">Luke VanderHart</span></h3> 
<div class="post-body">Functional programming!</div> 
<h1>CLojure Community Management</h1> 
<h3>By <span class="author">Ryan Neufeld</span></h3> 
<div class="post-body">Programmers are like...</div> 
<h1>Programming</h1> 
<h3>By <span class="author">Rich Hickey</span></h3> 
<div class="post-body">You're doing it completely wrong.</div> 
</body> 
</html> 


在 这 个 例子 中 ，defsnippet 宏 定 义 了 一 个 片段 ， 包 含 了 输入 HTML 中 的 一 些 元 素 ， 从 
<h1> 到 <div class="post-body">。 然后 ，all-posts-page 的 deftemplate 使 用 了 post- 
snippet 映射 到 body 元 素 的 内 容 之 后 的 结果 。 由 于 示例 输入 数据 中 有 三 个 海报 ， 这 个 片段 
被 求 值 三 次 ， 得 到 的 HTML 包含 了 三 个 海报 的 输出 。 
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讨论 

与 其 他 一 些 库 相 比 ，Enlive 可 能 有 一 点 难 上 手 。 这 有 以 下 几 个 原因 。 

。 它 比 其 他 模板 系统 具有 更 创新 的 概念 方法 (尽管 它 与 其 他 一 些 非 Clojure 模板 技术 有 许 
多 相似 之 处 ， 如 XSLT)。 

。 它 充分 利用 了 函数 式 编 程 技术 ， 包 括 自由 使 用 高 阶 函数 。 

。 它 是 一 个 很 大 的 库 ， 能 做 很 多 事 。 完 成 某 个 任务 所 需 的 功能 子 集 不 一 定 很 明显 。 

一 般 来 说 ， 要 解决 这 些 问 题 并 体验 Enlive 的 强大 和 灵活 ， 最 好 的 方法 就 是 分 别 理 解 所 有 不 

同 的 部 分 ， 以 及 它们 做 些 什么 。 然 后 ， 将 它们 组 合成 有 用 的 模板 系统 ， 变 得 更 容易 管理 。 






















































































Enlive 和 DOM 
首先 ， 要 理解 Enlive 不 直接 操作 HTML 文本 ， 这 一 点 很 重要 。 相 反 ， 它 先 将 HTML 解析 
成 Clojure 数据 结构 ， 表 示 为 DOM (文档 对 象 模型 ) 。 例 如 ，HTML 片段 : 





<div id="foo"> 
<span class="bar">Hello!</span> 
</div> 


将 被 解析 为 下 面 的 Clojure 数据 : 














{:tag :html, 
:attrs nil, 
:content 
({:tag :body, 
:attrs nil, 
:content 
({:tag :div， 
:attrs {:id "foo"}, 
:content 
({:tag :span, :attrs {:class "bar"}, :content ("Hello!")})})})} 


这 更 宛 长 ， 但 更 容易 在 Clojure 中 操作 。 你 不 需要 直接 处 理 这 些 数据 结构 ， 但 要 意识 到 ， 
Enlive 说 它 操作 一 个 元 素 或 节点 时 ， 是 指 该 元 素 的 Clojure 数据 结构 ， 而 不 是 HTML 字 
符 申 。 


模板 

这 些 例子 中 更 重要 的 部 分 是 def template 宏 。deftemplate 接受 一 个 符号 作为 名 称 ， 一 个 类 
路 径 的 相对 路 径 指 向 一 个 HTML 文件 ， 一 个 参数 列表 ， 一 系列 的 选择 器 (selector) 和 转 
换 函 数 (transform function) 对 。 它 定义 了 一 个 函数 ， 具 有 同样 名 称 和 指定 的 参数 。 调 用 
这 个 函数 ， 就 返回 一 个 字符 串 序 列 ， 作 为 产生 的 HTML。 


Enlive 的 选择 器 是 一 个 Clojure 数据 结构 ， 确 定 了 输入 HTML 文件 中 的 某 个 节点 。 它 们 
在 操作 上 与 CSS 选择 器 类 似 ， 但 能 力 更 强 。 在 解决 方案 的 例子 中 ，[:titte] 选择 了 每 个 
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<titLe>，[:span.author] 选择 了 每 个 带 有 class="author" 的 <span>， 等 等 。 下 面 的 小 节 


描述 了 更 多 的 选择 器 形式 。 














模板 的 转换 函数 接受 一 个 Enlive 节点 ， 返 回 修改 后 的 节点 。 我 们 的 例子 使 用 了 Enlive 的 
content 工具 国 数 ， 它 返回 一 个 国 数 ， 该 函数 用 它 的 参数 值 替 换 节 点 的 内 容 。 








返回 值 本 身 不 是 一 个 字符 串 ， 而 是 一 个 字符 串 序 列 ， 每 个 字符 串 表 示 一 小 段 HTML 内 容 。 
这 使 得 底层 的 数据 结构 能 够 惰性 地 转换 为 字符 串 的 形式 。 为 了 简单 ， 我 们 的 例子 对 结果 归 
约 调用 了 str 来 连接 字符 串 ， 但 这 样 做 实际 上 不 能 达到 最 佳 性 能 。 要 高 效 地 生成 一 个 字符 
串 ， 请 用 Java 的 StringBuilder 类 ， 它 利用 了 可 变 的 状态 来 构建 String 对 象 ， 性 能 最 好 。 
或 者 ， 完 全 跳 过 字符 串 合 并 ， 将 模板 函数 产生 的 序列 直接 传 给 输出 的 writer 对 象 ， 大 多 
数 Web 应 用 库 (包括 Ring) 都 可 以 用 它 作 为 HTTP 的 响应 体 (模板 化 的 HTML 最 常见 的 
去 处 )。 


选择 器 

Enlive 选择 器 是 一 些 数 据 结构 ， 确 定 一 个 或 多 个 HTML 市 点 。 它 们 描述 了 一 种 数据 模式 ， 
如 果 该 模式 匹配 HTML 数据 结构 中 的 某 些 节点 ， 选 择 器 就 会 选择 这 些 节 点 。 选 择 器 可 能 从 
给 定 的 HTML 文档 中 选择 一 个 、 多 个 或 零 个 节点 ， 这 取决 于 该 模式 有 多 少 匹 配 。 



































有 效 选择 器 形式 的 完整 参考 相当 复杂 ， 也 超出 了 本 实例 的 范围 。 完 整 的 文档 请 参考 选择 器 
的 规格 说 明 (http://enlive.cgrand.net/syntax.html)。 下 面 的 选择 器 模式 应 该 足够 让 你 开始 工 
作 了 : 




















[:div] 
选择 所 有 <div> 元 素 节 点 。 


[:div.sidebar] 


选择 所 有 带 有 CSS 类 "sidebar" 的 <div> 元 素 节 点 。 





[:div#summary] 


选择 带 有 HTML ID "summary" 的 <div> 元 素 节点 。 





[:p :span] 
选择 所 有 <p> 元 素 下 面 的 <span> 元 素 。 
[:div.meny :ul :li :span] 
选择 <div> 元 素 之 内 的 <ul> 元 素 之 内 的 <li> 元 素 之 内 的 <span> 元 素 ，<div> 元 素 带 有 
的 CSS 风格 为 "menu"。 
[[:div (nth-child 2)]] 
选择 所 有 是 父 元 素 的 第 二 个 子 元 素 的 <div> 元 素 。 双 方 括 号 不 是 打字 错误 ， 因 为 内 部 
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的 向 量 表示 一 种 逻辑 “与 ”条 件 。 在 这 个 例子 中 ， 匹 配 的 元 素 必 须 是 <div>， 并 且 nth- 
child 谓词 必须 为 真 。 











除 nth-child 外 ， 还 有 其 他 谓词 ， 也 可 以 定义 自己 的 谓词 。 详 细 内 容 请 参见 Enlive 文档 。 


最 后 ， 有 一 种 特殊 类 型 的 选择 器 名 为 范围 (range) 选择 器 ， 它 不 是 由 一 个 向 量 来 指定 ， 而 
是 由 一 个 映射 表 字 面 量 (在 花 括号 内 ) 来 指定 。 范 围 选 择 器 包含 另 两 个 选择 器 ， 它 按照 
文档 的 顺序 ， 匹 配 两 个 匹配 节点 之 间 的 所 有 节点 ( 含 这 两 个 节点 )。 开 始 节点 在 映射 表 常 
量 中 处 于 键 的 位 置 ， 0 的 位 置 ， 所 以 选择 器 {[:.foo] [:.bar]} 将 匹配 ID 
“foo” 和 ID “bar” 之 间 的 所 有 节 


解决 方案 中 的 例子 在 defsnippet 形式 中 使 用 了 一 个 范围 选择 器 ， 来 选择 逻辑 上 同一 篇 博客 
文章 的 所 有 市 点 ， 即 使 它们 没有 嵌 套 在 同一 个 父 元 素 中 。 
片段 


片断 与 模板 类 似 ， 它 们 都 基于 HTML 文件 得 到 一 个 函数 。 但 是 ， 片 断 与 模板 有 两 个 主要 的 
不 同 点 。 


(1) 不 像 模板 那样 总 是 生成 整个 HIML 文件 ， 片 断 只 泻 染 输入 HTML 的 一 部 分 。 要 演 染 的 
部 分 是 由 Enlive 选择 器 指定 的 ， 该 选择 器 作为 defsnippet 宏 的 第 三 个 参数 ， 跟 在 名 称 
和 HTML 文件 路 径 之 后 




































































(2) 生成 函数 的 返回 值 是 Enlive 数据 结构 ， 不 是 HTML 字符 串 。 
结果 可 以 直接 来 自 一 个 模板 的 转换 函数 或 其 他 片段 的 结果 。 
强大 的 地 方 ， 片 段 能 被 回收 和 大 量 复 用 ， 用 于 不 同 的 组 合 。 





味 着 泻 染 一 个 片段 的 


这 意 
这 就 是 Enlive 开始 展示 其 











除了 这 些 不 同 ，defsnippet 形式 和 deftemplate 一 样 ， 在 选择 器 之 后 ， 剩 下 的 参数 也 一 样 : 
一 个 参数 向 量 ， 一 系列 的 选择 器 和 转换 函数 对 。 


用 Enlive 提 取 数 据 
由 于 它 强 调 选 择 器 ， 而 且 使 用 了 普通 的 、 无 标注 的 HTML 文件 ， 所 以 Enlive 不 仅 非 常 适 
合 利 用 模板 来 生成 HIML， 也 非常 适合 解析 来 自任 何 来 源 的 HTML， 并 从 中 提取 数据 。 


要 利用 Enlive 从 HTML 中 提取 数据 ， 必 须 先 将 HTML 文件 解析 成 Enlive 数据 结构 。 要 做 
到 这 一 点 ， 只 要 对 HTML 文件 调用 net.cgrand.enlive-html/html-resource 国 数 。 你 可 以 
将 该 文件 指定 为 一 个 java.net.URL 对 象 、 一 个 java.io.File 对 象 ， 或 一 个 表示 类 路 径 的 
相对 路 径 的 字符 串 。 函 数 将 返回 解析 后 的 Enlive 数据 结构 ， 表 示 HTML 的 DOM。 





然后 ， 可 以 用 net.cgrand.enlive-html/select 函数 ， 将 选择 器 应 用 于 DOM 并 提取 特定 的 
数据 。 给 定 一 个 节点 和 一 个 选择 器 ，select 将 只 返回 那些 匹配 的 节点 。 接 下 来 可 以 用 net. 
cgrand.enlive-html/text 国 数 取得 节点 的 文本 内 容 。 
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例如 ， 下 面 的 函数 将 返回 一 个 序列 ， 包 含 XKCD 档案 中 最 近 n 个 漫画 书 标题 : 


(defn comic-titles 
[n] 
(let [dom (html/html-resource 
(java.net.URL. "http://xkcd.com/archive")) 





title-nodes (html/select dom [:#middleContainer :a]) 


titles (map htmL/text title-nodes)] 
(take n titles))) 


(comic-titles 5) 


;; -> ("Oort Cloud" "Git Commit" "New Study" 
"Telescope Names" "Job Interview") 


何 时 使 用 Enlive 





作为 HTML 模板 系统 ，Enlive 有 两 个 主要 的 价值 点 ， 胜 过 Clojure 生态 系统 中 的 其 他 可 选 


方案 。 


首先 ， 模 板 是 纯 HIML。 这 使 得 与 HIML 设计 师 合 作 变 得 比较 容易 : 他 们 可 以 将 HTML 
的 设计 直接 交 给 开发 者 ， 不 必 在 里 面 伐 入 标记 代码 ， 开 发 者 可 以 直接 使 用 ， 不 必 手 工 进 行 
切割 (也 就 是 说 ， 在 代码 之 外 )。 而 且 ， 模板 本 身 可 以 在 浏览 器 中 静态 地 查看 ， 这 意味 着 




















它们 可 以 作为 自己 的 页 面 线 框图 (wireframe)。 这 消除 了 负担 ， 
觉 原型 与 代码 的 同步 。 























不 需要 保持 Web 项 目的 视 


其 次 ， 因 为 它 使 用 了 真正 的 Clojure 函数 和 数据 结构 ， 而 不 是 定制 的 DSL， 所 以 Enlive 充 





分 展示 了 Clojure 语言 的 威力 。 几 乎 很 难 发 现 Enlive 的 能 力 有 人 


上 么 限制 ， 只 要 用 Clojure 的 


函数 和 安 就 可 以 扩展 它 ， 操 作 熟 悉 的 、 稳 定 的 、 不 可 改变 的 数据 结构 。 


参阅 
Enlive 的 文档 (https:Wgithub.comy/cgrand/enlive/wiki) 。 


David Nolen 的 Enlive 指南 (https:Wgithub.com/swannodette/enlive-tutorial ) 。 


。 Enlive 的 邮件 列表 (https://groups.google.com/forum/#!forum/enlive-clj ) 。 


。 另外 的 模板 库 Selmer (7.12 节 ) 和 Hiccup (7.13 节 )。 


7.12 用 Selmer 实 现 模板 


作者 : Dmitri Sotnikov 





问题 





并 使 用 模板 继承 来 构成 模板 。 


希望 使 用 类 似 Django 和 Jinja 的 语法 ， 创 建 服务 器 端的 页 面 模板 。 希 望 能 够 插入 动态 内 容 ， 








A 
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解决 方案 
使 用 Selmer 库 (https://github.com/yogthos/Selmer) 来 创建 模板 ， 并 用 一 个 包含 动态 内 容 的 
上 下 文 映射 表 来 调用 它 。 








要 继续 本 实例 ， 请 用 Lein-try 启动 REPL: 


$ lein try seLmer 





Selmer 模板 是 包含 特殊 标签 的 HTML 文档 ， 这 些 标签 将 在 运行 时 被 动态 内 容 填充 。 一 
简单 的 模板 (base.html) 看 起 来 是 这 样 的 : 











<!DOCTYPE htmL> 
<html lang="en"> 
<body> 
<header> 


<h1i>{{header}}</h1> 
<UL id="navigation"> 


{% for item in nav-items %} 
<li> 
<a href="{{item.link}}">{{item.name}}</a> 
</Li> 
{% endfor %} 


</ul> 
</header> 
</body> 
</html> 


调用 selmer .parser/render-file 函数， 可 以 深 染 该 模板 ; 


(require '[selmer.parser :refer [render-file]]) 


(println 
(render-file "base.html" 
{:header "Hello Selmer" 
:Nav-items [{:name "Home" :link "/"} 
{:name "About" :link "/about"}]})) 

















在 render-file 执行 时 ， 它 将 用 提供 的 内 容 填充 那些 标签 。 值 将 作为 一 个 字符 串 返 回 ， 适 
合作 为 Ring 应 用 的 响应 体 (比方 说 )。 这 里 只 是 简单 地 在 标准 输出 中 打印 出 结果 ， 目 的 是 


易于 查看 。 


在 运行 时 ， 我 们 可 以 对 变量 应 用 过 滤器 ， 进 行 附加 的 事后 处 理 。 在 这 里 ， 我 们 用 upper 过 
滤器 将 标题 转换 成 大 写 : 











<h1>{{header|upper}}</h1> 
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利用 inctude 标签 ， 我 们 可 以 提取 模板 的 一 些 部 分 ， 成 为 独立 的 片段 。 例 如 ， 如 果 和 希望 在 


独立 的 文件 header.html 中 定义 标题 : 
<header> 
<h1i>{{header}}</h1> 


<UL id="navigation"> 


{% for item in nav-items %} 
<li> 


<a href="{{item. link}}">{{item.name}}</a> 
</li> 
{% endfor %} 


</ul> 
</header> 


然后 就 可 以 这 样 包含 它 : 
<!DOCTYPE html> 
<html lang="en"> 


<body> 


{% include "header.html" %} 


</body> 
</html> 





在 模板 编译 时 ，include 标签 就 会 被 它 所 指 文件 的 内 容 替 换 。 








在 创建 独立 的 页 面 时 ， 我 们 也 可 以 扩展 基本 模板 。 要 做 到 这 一 点 ， 我 们 先 在 基本 模板 中 定 





义 一 个 块 。 它 将 作为 一 个 销 ， 让 子 模板 来 履 写 : 
<!DOCTYPE htmL> 
<html lang="en"> 
<body> 
{% include "header.html" %} 


{% block content %} 
{% endblock %} 


</body> 
</html> 


子 模板 通过 extends 标签 来 引用 父 模 板 ， 并 为 content 块 定义 自己 的 内 容 : 
{% extends "base.html" %} 


{% block content %} 
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<h1>This is the home page of the site</h1> 
<p>some exciting content foLLows</p> 


{% endblock %} 
讨论 
Selmer 提供 了 一 个 强大 而 熟悉 的 模板 工具 ， 包 含 许 多 标签 和 过 滤器 ， 很 容易 实现 许多 常 见 


的 任务 。 它 通过 设计 分 离 了 视图 逻辑 和 展现 。Selmer 的 性 能 也 很 好 ， 因 为 它 编译 模板 ， 确 
保 只 在 服务 请 求 时 才 对 动态 内 容 求 值 。 


Selmer 的 概念 
Selmer 包含 两 种 类 型 的 元 素 : 变量 和 标签 。 


变量 用 于 在 页 面 上 泻 染 来 自 上 下 文 映射 表 中 的 值 。{{ 和 二 用 于 表明 变量 的 起 始 和 终止 。 









































在 许多 时 候 ， 你 可 能 希望 对 变量 的 值 进行 事后 处 理 。 例 如 ， 和 希望 将 它 转换 成 大 写 ， 变 成 复 
数 ， 或 将 它 解 析 为 日 期 。 变 量 过 滤器 〈 在 下 面 的 小 节 中 描述 ) 就 是 用 于 这 个 目的 。 

标签 用 于 向 模板 中 添加 各 种 功能 ， 诸 如 循环 和 条 件 。 我 们 已 经 看 到 了 for、inctude 和 
extends 标签 的 例子 。 这 些 标签 用 从 和 和 弛 来 定义 它们 的 内 容 。 




















默认 的 标签 字符 可 能 与 客户 端的 框架 冲突 ， 例 如 AngularJS。 在 这 种 情况 下 ， 我 们 可 以 通 
过 向 解析 器 传人 一 个 映射 表 指 定 定制 的 标签 ， 包 含 以 下 键 : 


:tag-open 
:tag-close 
:filter-open 
:filter-close 
:tag-second 
:CUustom-tags 
:custom-filters 











如 果 我 们 想 用 [ 和 ] 作为 开始 标签 和 关闭 标签 ， 可 以 这 样 调用 render 函数 : 


(render (str "[% for ele in foo %] " 
"{{I'm not a tag, but the next one is}} [{ele}] [%endfor%]") 
{:foo [1 2 3]} 
{:tag-open \[ 
:tag-close \]}) 





render 函数 与 render-file 功能 一 样 ， 只 是 它 以 字符 串 的 方式 接受 模板 内 容 。 
Selmer 提供 了 丰富 的 过 滤器 ， 用 于 修饰 动态 内 容 。 例 如 capitalize、pluralize、hash、length 
和 sort 等 。 

















但 是 ， 如 果 需 要 定制 库 中 没有 的 过 滤器 ， 那 也 很 容易 。 例 如 ， 如 果 需 要 用 markdown-c1j 库 
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(https:/Wgithub.com/yogthosmarkdown-cjj) 来 解析 Markdown 并 显示 在 页 面 上 ， 我 们 可 以 编 
写 下 面 的 过 滤器 "， 





(require '[markdown.core :refer [md-to-html-string]] 
'[selmer.filters/add-filter!]) 


(add-filter! :markdown md-to-html-string) 
现在 我 们 可 以 在 模板 中 用 这 个 过 滤器 来 泻 染 Markdown 的 内 容 : 


<h2>Blog Posts</h2> 
<ul> 
{% for post in posts %} 
<li>{{post.title|markdown|safe}}</\li> 
{% endfor %} 
</ul> 


请 注意 ， 我 们 必须 在 markdown 过 滤器 后 面 加 上 safe 过 滤器。 这 是 因为 Selmer 默认 会 转 义 
可 变 的 内 容 。 我 们 可 以 改变 过 滤器 的 定义 ， 告 诉 它 不 需要 转 义 ， 就 像 这 样 : 








(add-filter! :markdown (fn [s] [:safe (md-to-html-string s)])) 


定义 标签 
同样 ， 除 了 库 里 已 有 的 标签 ， 我 们 也 可 以 定义 定制 的 标签 。 这 是 通过 调用 selmer .parser/ 
add-tag! 国 数 来 完成 的 。 


假定 我 们 希望 添加 一 个 标签 ， 将 它 的 内 容 转换 成 大 写 : 








(require '[selmer.parser :refer [add-tag!]]) 


(add-tag! :uppercase 
(fn [args context-map content] 
(.toUpperCase (get-in content [:uppercase :content]))) 
:enduppercase) 


(render "{% uppercase %}foo {{bar}} baz{% enduppercase %}" {:bar "injected"}) 


继承 

我 们 已 经 看 到 了 一 些 模板 继承 的 例子 。 每 个 模板 都 可 以 扩展 一 个 模板 ， 并 且 可 以 在 内 容 中 
包含 多 个 模板 。 继 承 的 模板 还 可 以 再 继承 。 在 这 种 情况 下 ， 最 下 层 子 模板 中 的 块 将 覆 写 所 
有 名 称 一 样 的 块 。 











参阅 
。 Selmer 的 GitHub 代码 库 (https://github.com/yogthos/Selmer)。 








注 2: 要 尝试 这 个 例子 ， 你 需要 用 Lein-try 重新 启动 REPL， 带 上 markdown-clj。 
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7.13 用 Hiccup 实 现 模 板 


作者 : Ryan Neufeld 





使 用 Hiccup 库 ， 它 展现 并 泻 染 由 普通 Clojure 数据 结构 构成 的 HTML 模板 。 








要 继续 这 个 实例 ， 就 用 Lein-try 启动 REPL: 


$ lein try hiccup 





Hiccup 将 HTML 市 点 表示 为 向 量 。 向 量 的 第 一 项 是 元 素 的 名 称 ， 第 二 项 是 一 个 元 素 属 性 


的 可 选 映射 表 ， 剩 下 的 项 是 元 素 体 : 


;; <h1 class="header">My Page Title</h1i> in Hiccup... 
[:h1 {:class "header"} "My Page Title"] 


;; <UL> 
;; <li>lions</li> 
pe <li>tigers</li> 
<li>bears</li> 
;; </ul> in Hiccup... 
[:ul 
[:LL "lions"] 
[:LL "tigers"] 
[:LL "bears"]] ;; oh my! 





用 hiccup.core/html 函数 将 Hiccup 数据 结构 六 当成 HTML: 


(require '[hiccup.core :refer [htmL]]) 
(html [:h1 {:class "header"} "My Page Title"]) 
;; -> "<h1 class=\"header\">My Page Title</h1i>" 


由 于 节点 表示 为 普通 的 Clojure 数据 ， 所 以 你 可 以 用 任何 Clojure 内 建 的 函数 或 技术 来 生成 


符合 Hiccup 要 求 的 向 量 : 


(def pi 3.14) 
(html [:p (str "Pi is approximately: " pi)]) 
;; -> "<p>Pi is approximately: 3.14</p>" 


(html [:ul 
(for [animal ["lions" "tigers" "bears"]] 
[:LL animal])]) 
;; -> "<ul><li>lions</\li><li>tigers</li><li>bears</li></ul>" 
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的 内 














利用 前 面 所 有 的 技术 ， 可 以 创建 一 个 简单 的 函数 ， 动 态 地 填充 一 个 最 小 的 博客 页 国 
容 ， 其 中 只 用 到 Clojure 的 函数 和 数据 : 


(defn blog-index 
"Render a blog's index as Hiccup data" 
[title author posts] 
[ :htmL 
[:head 
[:title title]] 
[:body 
[:h1 titlel] 
[:h2 (str "By " author)] 
(for [post posts] 
[:article 
[:h3 (:title post)] 
[:p (:content post)]])]]) 
(-> (blog-index "My First Blog" 
"Ryan" 
[{:title "First post!" :content "I'm here!"} 
{:title "Second post." :content "Yawn, bored."}]) 


htmL) 


格式 化 后 的 输 晶 





UL 
漆 


<htmL> 
<head> 
<title>My First Blog</title> 
</head> 
<body> 
<hi>My First BLog</h1> 
<h2>By Ryan</h2> 
<article> 
<h3>First post!</h3> 
<p>I'm here!</p> 
</article> 
<article> 
<h3>Second post.</h3> 
<p>Yawn, bored.</p> 
</article> 
</body> 
</html>" 


讨论 
Hiccup 是 一 种 简单 的 、 干 脆 利 落 的 模板 方式 ， 通 过 原始 的 函数 和 数据 来 浑 染 HTML。 如 果 
你 没有 时 间 来 学 习 一 种 新 的 DSL， 或 者 你 只 喜欢 在 Clojure 下 工作 ， 它 就 特别 方便 。 











一 个 HTML 节点 在 Hiccup 中 表示 为 一 个 向 量 ， 包 含 以 下 一 些 元 素 : 





。 节点 的 名 称 ， 表 示 为 关键 字 (例如 :h1、:articte 或 :body) ; 





大 
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。 包含 节点 属性 的 可 选 的 映射 表 , 属性 名 称 表 示 为 关键 字 〈 例 如 {:href "/posts/"} 或 {:id 


"post-1" :class "post"}) ; 

















。 从 
用 单 














生意 数目 的 其 他 节点 或 字符 串 的 值 ， 构 成 该 节点 的 节点 体 。 





个 节点 、 片 段 或 整个 页 面 来 调用 hiccup.core/html， 就 会 将 它们 的 内 容 泻 染 成 HTML。 











对 于 带 有 特殊 字符 、 应 该 转 义 的 内 容 ， 通 过 调用 hiccup.core/h 将 它们 包装 起 来 : 





(require '[hiccup.core :refer [h]]) 
(html [:a {:href (h "/post/my<crazy>url")}]) 
;; -> "<a href=\"/post/my&amp;lt;crazy&amp;gt;url\"></a>" 


Hiccup 对 泻 染 表单 也 有 基本 的 支持 。 使 用 hiccup.forn 命名 空间 的 form-to 和 一 些 其 他 辅 
助 函 数 ， 来 简化 泻 染 表单 标签 


(require '[hiccup.form :as f]) 


(f/form-to [:post "/posts/new"] 
(f/hidden-field :user-id 42) 
(f/text-field :title) 
(f/text-field :content)) 
;; -> [:form {:method "POST", :action #<URI /posts/new>} 


2 [:input {:type "hidden" 
Pe :Name "user-id" 
人 :id "user-id" 
ps :value 42}] 
和 [:input {:type "text" 
3 :Name "title" 
2 :id "title" 
人 :value nil}] 
os [:input {:type "text" 
i :Name "content" 
:id "content" 
5 :value nil}]] 
My 
参阅 


Hiccup 的 GitHub 代码 库 (https://github.com/weavejester/hiccup/)，API 文档 (http://weave- 


es 


如 果 对 模板 引擎 有 更 复杂 的 需求 (例如 消费 并 填充 已 有 的 HTML 文件 )， 你 可 能 需要 像 





Enlive (7.11 节 ) 或 Selmer 人 这 种 更 强大 的 工具 。 


7.14 泻 染 Markdown 文 档 


作者 : Dmitri Sotnikov 


问题 
需要 演 染 Markdown 文档 。 
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解决 方案 


使 用 markdown-clj 库 (https://github.com/yogthos/markdown-clj) 来 党 染 Markdown 文档 。 








要 继续 这 个 实例 ， 请 用 lein-try 启动 REPL: 
$ lein try markdown-clj 


用 markdown.core/md-to-html 来 读 取 Markdown 文档 ， 并 生成 包含 HTML 的 字符 串 : 








(require '[markdown.core :as md]) 
(md/md-to-html "input.md" "output.html") 


(md/md-to-html (input-stream "input.md") (output-stream "test.txt")) 


用 markdown.core/md-to-html-string 将 包含 Markdown 内 容 的 字符 串 转 换 成 HTML 表现 
形式 : 


(md/md-to-htmL-string 
"# This is a test\n\nsome code foLLows:Nn \n(defn foo [])Nn  ") 


<h1> This is a test</h1><p>some code follows:</p><pre> 


&#40;defn foo &#91;&#93;&#41; 
</pre> 


讨论 
Markdown 是 一 种 流行 的 轻 量 级 标记 语言 ， 很 容易 读 写 ， 并 能 转换 成 结构 上 有 效 的 HTML。 














由 于 Markdown 将 泻 染 HTML 的 许多 方面 留 给 了 解析 器 自由 实现 ， 所 以 不 能 保证 不 同 的 解 
析 器 会 得 到 同样 的 结果 。 如 果 在 客户 端 用 一 个 解析 器 来 泻 染 Markdown 的 预览 图 ， 然 后 在 
服务 器 端 用 另 一 个 解析 器 来 生成 HTML， 这 可 能 会 有 问题 。 由 于 markdown-clj 被 编译 成 
Clojure 和 ClojureScript 两 个 版 本 ， 所 以 它 避 免 了 这 个 问题 。 有 了 它 ， 你 可 以 在 服务 器 和 客 
户 端 使 用 同一 个 解析 器 ， 保 证 文档 得 到 一 致 的 泻 染 。 


让 我 们 来 看 看 更 多 使 用 该 库 的 例子 。 代 码 块 可 以 用 标注 说 明 是 哪 种 语言 。 在 这 个 例子 中 ， 
pre 标签 将 被 一 个 类 修饰 ， 该 类 符合 SyntaxHighlighter (语法 高 亮 器 ，http://alexgorbatchev. 
com/SyntaxHighlighter/) : 





























(md/md-to-html-string (str "# This is a test\n\nsome code follows:\n" 
"* clojure\n(defn foo [])\n. …")) 


<h1> This is a test</h1><p>some code follows:</p><pre class="brush: clojure"> 
&#40;defn foo &#91;&#93;&#41; 
</pre> 





markdown-clj 支持 所 有 标准 的 Markdown 标签 ， 但 引用 风格 的 链接 除外 (因为 解析 器 用 一 
遍 的 方式 来 生成 文档 )。markdown.core/md-to-html 一 行 一 行 地 处 理 输 入 ， 在 处 理 时 ， 完 整 
的 内 容 不 需要 保存 在 内 存 中 。 男 一 方面 ，md-to-html-string 和 md-to-html 都 会 将 全 部 内 
容 加 载 到 内 存 中 。 


解析 器 接受 额外 的 格式 化 选项 。 这 包括 :heading-anchors、:code-style、:custom-transf 


ormers 和 :replacement-transformers。 

















如 果 :heading-anchors 键 设置 为 true， 就 会 为 每 个 标题 标签 生成 一 个 销 : 
(md/md-to-html-string "###foo bar BAz" :heading-anchors true) 


<h3> 
<a name=\"heading\" class=\"anchor\" href=\"#foo&#95;bar&#95;baz></a> 
foo bar BAz 

</h3> 


:code-style 键 允 许 覆 写 代 码 块 的 默认 风格 提示 : 


(md/md-to-html-string "* “clojure\n(defn foo [])Nn  \" 
:code-style #(str "class=\"" % "\"")) 


<pre class="clojure"> 
&#40;defn foo &#91;&#93;&#41; 
</pre> 





我 们 可 以 用 :custom-transformers 键 ， 为 定制 的 标签 指定 转换 器 。 转 换 器 函数 应 该 接受 
text 参数 ， 它 代表 当前 行 ， 以 及 state 参数 ， 它 包含 解析 器 的 当前 状态 。 状 态 可 以 用 来 保 
存 一 些 信息 ， 比 如 哪些 标签 是 激活 的 : 





(defn capitalize [text state] 
[(.toUpperCase text) state]) 


(md/md-to-html-string "#foo" :custom-transformers [capitalize]) 


<H1>F00</H1> 


最 后 ， 我 们 可 以 用 :replacement-transformers 键 提供 一 组 定制 的 转换 器 ， 赫 代 内 建 的 转 
换 器 : 





(markdown/md-to-html-string "#foo" :replacement-transformers [capitalize]) 


参阅 
。 markdown-clj 的 GitHub 代码 库 (https://github.com/yogthos/markdown-clj)， 了 解 该 库 的 
更 多 信息 。 
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7.15 用 Luminus 来 构建 应 用 
作者 : Dmitri Sotnikov 
问题 


希望 很 快 创 建 一 个 典型 的 、 基 于 Ring/Compojure 的 Web 应 用 结构 ， 快 速 开始 新 的 Web 开 
发 项 目 。 


解决 方案 
在 创建 新 项 目 时 ， 使 用 Luminus 的 Leiningen 模板 。 


在 命令 行 输入 : 








$ lein new luminus myapp 





这 将 创建 一 个 新 的 Ring/Compojure 应 用 ， 带 有 命名 空间 骨架 和 资源 目录 结构 ， 可 以 打包 
成 独立 的 Java 档案 (JAR) 文件 ， 或 可 以 直接 部 署 在 应 用 服务 器 上 的 Web 档案 (WAR) 
文件 。 


在 开发 模式 下 ， 启 动 应 用 只 要 执行 : 














$ lein ring server 


讨论 
虽然 Luminus 能 做 的 事情 你 自己 也 能 完成 ， 但 它 提 供 了 一 组 标准 化 的 库 和 样板 文件 ， 用 于 
创建 常见 的 Ring/Compojure 应 用 。 








该 模板 在 你 的 项 目 中 生成 了 标准 的 目录 结构 ， 定 义 了 应 用 的 主 处 理 函数 ， 在 project.clj 文 
件 中 添加 了 lein-ring 的 钩子 ， 提 供 了 默认 的 日 志 配置 ， 并 且 建 立 了 默认 的 路 由 。 


在 创建 应 用 时 ， 你 可 以 指定 一 些 特性 描述 来 添加 功能 ， 这 些 特 性 描述 扩展 了 生成 的 代 
码 ， 目 的 是 包含 相关 的 组 件 。 下 面 是 一 些 例子 ， 在 初始 化 应 用 时 包含 了 不 同 数据 库 的 默 
认 配 置 : 












































$ lein new luminus app1 +h2 


# 或 用 PostgreSQL: 
$ Lein new Lumtnus app2 +postgres 


# 或 ClojureScript! 
$ lein new Luminus app3 +cljs 








# 你 也 可 以 同时 指定 多 个 特性 描述 : 


$ lein new luminus app4 +cljs +postgres 




















7 





得 到 的 应 用 在 结构 上 使 用 了 下 面 的 命名 空间 。 











<app-name>.handler 命名 空间 包含 了 init 和 destroy 函数 。 它 们 分 别 在 应 用 启动 和 关闭 时 


被 调用 。 它 也 包含 了 app 处 理 函 数 ， 被 Ring 用 来 初始 化 路 由 处 理 器 。 





<app-name>.routes 命名 空间 用 于 存放 应 用 的 核心 逻辑 。 这 是 你 定义 应 用 路 由 及 其 处 理 函 数 
的 地 方 。<app-name>.routes.home 命名 空间 包含 了 默认 的 /和 /about 页 面 的 路 由 。 


站 





点 的 布局 是 由 <app-name>.views.layout 命名 空间 中 的 render 函数 生成 的 。 页 面 的 


HTML 模板 可 以 在 src/<app-name>/views/templates/ 下 找到 。Luminus 使 用 Selmer (https:// 
github.com/yogthos/Selmer) 作为 默认 的 模板 引擎 ， 这 在 7.12 节 “ 用 Selmer 实现 模板 ”中 
介绍 过 。 


其 


区 


也 各 种 辅助 函数 放 在 <app_name>.views.util 命名 空间 中 。 

















如 果 选 择 了 数据 库 特 性 描述 ， 就 会 创建 <app_name>.models.db 和 <app_name>.models.schema 
命名 空间 。schema 命名 空间 为 表 定义 而 保留 ，db 命名 空间 存放 处 理应 用 模型 的 函数 。 











应 用 可 以 用 Lein ring uberjar 打包 成 独立 的 JAR 文件 ， 或 用 Lein ring uberwar 打包 成 
WAR 文件 。 


参阅 


Luminus 项 目 主 页 (http://www.luminusweb.net/)。 
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第 8 和 章 


性 能 与 开发 效率 





8.0 简介 


你 已 经 花 了 一 段 时 间 来 开发 一 个 大 项 目 : 除了 发 布 之 外 ， 接 下 来 该 做 些 什 么 ? 不 论 它 是 产 
品 、 内 部 服务 ， 还 是 库 ， 最 后 一 步 〈 也 是 最 重要 的 一 步 ) 就 是 将 你 的 劳动 成 果 交 付 给 目标 
客户 。 

开发 者 很 容易 忘记 ， 代 码 完成 只 是 应 用 的 真正 生命 周期 的 开始 。 成 功 的 项 目 将 在 生产 阶段 
经 历 更 多 的 时 间 ， 远 超过 开发 阶段 ， 稳 定性 与 可 维护 性 是 更 宝贵 的 特性 。 


本 章 全 部 内 容 都 在 探讨 真正 完成 工作 ， 让 构建 的 软件 能 在 接 下 来 的 数 年 里 尽 可 能 无 痛苦 地 
运行 。 对 于 任务 性 能 、 日 志 、 发 布 版 本 或 长 期 维护 来 说 ， 最 重要 的 是 发 布 真 正 优秀 的 软 
件 。 就 像 孩子 初次 脱离 父母 的 庇护 一 般 ， 我 们 对 于 新 构建 的 软件 ， 当 然 会 有 很 多 担心 ， 我 
们 希望 这 些 实例 能 帮助 你 做 出 正确 的 应 对 。 








下 








8.1 AOT 编 译 


作者 : Luke VanderHart 


问题 
希望 以 预 编译 的 JVM 字 节 码 ， 即 .class 文件 的 方式 来 交付 你 的 代码 ， 而 不 是 以 Clojure 源 
代码 的 方式 。 
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解决 方案 

在 项 目的 project.clj 文件 中 使 用 :aot (事先 ) 编译 键 ， 指 明 应 该 编译 成 ,class 文件 的 命名 空 
间 。:aot 键 的 值 是 一 个 向 量 ， 包 含 一 些 具体 要 编译 的 命名 空间 ， 或 者 一 些 正则 表达 式 字面 
量 ， 指 明 名 称 匹 配 的 命名 空间 应 该 编译 。 或 者 不 用 向 量 ， 你 可 以 用 关键 字 :all 作为 值 ， 这 
样 将 事先 编译 项 目的 所 有 命名 空间 : 


:aot [foo.bar foo.baz] 

















加 


:aot [#"foo\.b.+"] ; 编译 以 "foo.b" 开始 的 所 有 命名 空间 





ye OF ss 
:aot :all 





请 注意 ， 如 果 项 目 已 经 指定 了 :main 命名 空间 ，Leiningen 默认 会 事先 编译 它 ， 不 论 它 是 否 
出 现在 :aot 的 值 中 。 





在 项 目 配置 为 AOT 编译 后 ， 就 可 以 在 命令 行 执 行 lein compile， 对 它 进行 编译 。 所 有 生 
成 的 类 将 放 在 target/classes 目录 下 ， 除 非 用 :target-path 或 :compile-path 选项 覆 写 了 输 
出 目录 。 


讨论 

重要 的 是 要 理解 ，AOT 编译 没有 改变 代码 实际 运行 的 方式 。 它 没有 变 得 更 快 ， 也 没有 变 得 
不 同 。 所 有 Clojure 代码 都 会 先 被 编译 成 字 节 码 ， 然 后 再 执行 。AOT 编译 只 是 说 它 在 一 个 
固定 的 时 间 点 一 次 完成 ， 而 不 是 在 程序 加 载 和 运行 时 按 需 完成 。 

但 是 ， 尽 管 没 有 变 得 更 快 ， 它 在 下 列 情况 中 却 是 非常 好 的 工具 。 

。 希望 交 付 应 用 的 二 进 制 代码 ， 但 不 希望 包含 源 代码 。 

。 希望 应 用 的 启动 时 间 加 快 一 点 (因为 Clojure 代码 就 不 必 当 场 编译 了 )。 

。 希望 生成 一 些 类 ， 直 接 由 Java 加 载 ， 实 现 互 操作 。 
。 针对 一 些 平台 (如 Android) ， 它 们 不 支持 定制 类 加 载 器 ， 在 运行 时 执行 新 的 字 节 码 。 





























你 可 能 会 注意 到 ， 对 每 个 AOT 编译 的 命名 空间 ， 不 止 生成 一 个 类 文件 。 实 际 上 ， 对 每 个 
函数 ， 命 名 空间 本 身 ， 以 及 所 有 附加 的 gen-class、deftype 或 defrecord 形式 ， 都 会 生成 
独立 的 Java 类。 这 实际 上 与 Java 本 身 没 有 不 同 ，Java 也 总 是 将 内 部 类 编译 成 独立 的 类 文 


件 ， 从 JVM 的 角度 来 看 ，Clojure_ 国 ; 委 ea 
参阅 


。 Clojure 关于 AOT 编译 的 官方 文档 (http://clojure.org/compilation)。 
。 8.2 节 “ 将 项 目 打包 成 JAR 文件 ”。 











8.2 将 项 目 打包 成 JAR 文 件 


作者 : Alan Busby 


希望 将 项 目 打包 成 可 执行 的 JAR。 


解决 方案 
用 Leiningen 构建 工具 ， 将 应 用 打包 成 一 个 uberjar， 即 包含 应 用 和 所 有 依赖 关系 的 JAR 文件 。 
要 继续 本 实例 ， 先 创建 一 个 新 的 Leiningen 项 目 : 





$ Letin new foo 
在 项 目的 project.clj 文件 中 添加 :main 和 :aot 参数 ， 将 项 目 配置 为 可 执行 的 : 


(defproject foo "0.1.0-SNAPSHOT" 
:description "FIXME: write description" 
:url "http://example.com/FIXME" 
:license {:name "Eclipse Public License" 
:url "http://www.eclipse.org/legal/epl-v10.html"} 
:dependencies [[org.clojure/clojure "1.5.1"]] 
:main foo.core 
:aot :all) 


要 让 项 目 可 执行 ， 在 src/foo/core.clj 文件 中 添加 -main 函数 和 :gen-class 声明 。 删 除 原 有 
的 foo 函数 : 


(ns foo.core 
(:gen-class)) 


(defn -main [& args] 
(->> args 
(interpose " ") 
(apply str) 
(println "Executed with the following args: "))) 


用 Lein run 命令 执行 应 用 ， 验 证 它 工作 正常 : 
$ lein run 123 

调用 Lein uberjar， 将 应 用 和 所 有 依赖 关系 打包 : 
$ lein uberjar 


Created /tmp/foo/target/uberjar/foo-0.1.0-SNAPSHOT.jar 
Created /tmp/foo/target/foo-0.1.0-SNAPSHOT-standalone.jar 
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执行 生成 的 target/foo-0.1.0-SNAPSHOT-standalone.jar 文件 ， 即 用 -jar 选项 将 它 传递 给 java: 


$ java -jar target/foo-1.0.0-standalone.jar 123 
Executed with the following args: 123 


讨论 
可 执行 的 JAR 文件 提供 了 一 种 极 好 的 方法 将 文件 打包 ， 这 样 就 能 提供 给 用 户 ， 由 cron 任 
务 调用 ， 与 其 他 Unix 工具 组 合 使 用 ， 或 在 适用 命令 行 的 其 他 场景 下 使 用 。 























在 背后 ， 可 执行 的 JAR 文件 与 其 他 JAR 文件 一 样 ， 都 包含 一 组 程序 资源 ， 如 类 文件 、 
Clojure 源 文件 和 classpath 资源 。 此 外 ， 可 执行 的 JAR 文件 还 包含 一 些 元 数据 ， 表 明 哪 个 
类 包含 main 方法 ， 这 在 它 内 部 的 manifest 文件 的 Main-Class 标签 中 指明 。 


























Leiningen 的 uberjar 是 一 个 JAR 文件 ， 它 不 仅 包含 你 的 程序 ， 还 打包 了 所 有 的 依赖 关系 。 
在 Leiningen 生成 uberjar 时 ， 它 能 检测 project.clj 中 的 :main 信息 ， 得 知 程序 提供 了 一 个 
-main 图 数 ， 生 成 适当 的 manifest 文件 ， 确 保 得 到 的 JAR 文件 是 可 执行 的 。 




















命名 空间 中 的 :gen-class 以 及 :aot 的 Leiningen 选项 是 必要 的 ， 这 样 才能 将 Clojure 源 代 
码 预 编译 成 JVM 的 类 ， 因 为 manifest 文件 中 的 “Main-Class” 条 目 不 知 道 如 何 引 用 或 编译 
Clojure 源 文件 。 


打包 JAR 时 不 带 依赖 关系 
在 打包 项 目 时 ，Leiningen 既 可 以 带 上 依赖 关系 ， 也 可 以 不 带 依赖 关系 。 





























jar 命令 打包 项 目 代 码 时 ， 不 带 任何 上 游 依 赖 关系 。 其 至 Clojure 本 身 也 不 包含 在 JAR 文 
件 内 ， 你 需要 BYOC'。 





在 foo 项 目 中 调用 Lein jar 命令 ， 将 生成 target/foo-0.1.0-SNAPSHOT.jar: 





$ lein jar 
Created /tmp/foo/target/jar/target/foo-0.1.0-SNAPSHOT.jar 





用 unzip 命令 列 出 JAR 文件 的 内 容 , 你 会 看 到 打包 的 内 容 很 少 ， 只 有 一 个 Maven 的 .pom 
文件 ， 生 成 的 JVM 类 文件 ， 以 及 项 目的 其 他 一 些 文件 : 














$ unzip -L target/foo-0.1.0-SNAPSHOT.jar 
Archive: target/foo-0.1.0-SNAPSHOT.jar 
Length Date Time Name 


2595 12-06-13 10:26 META-INF/maven/foo/foo/pom.xml 














注 1: 带 上 你 自己 的 Clojure ! 
注 2: 大 多 数 类 Unix 系统 都 提供 。 
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91 12-06-13 10:26 META-INF/maven/foo/foo/pom.properties 
292 12-06-13 10:26 META-INF/leiningen/foo/foo/project.c1lj 
292 12-06-13 10:26 project.clj 
229 12-06-13 10:26 META-INF/leiningen/foo/foo/README.md 

11220 12-06-13 10:26 META-INF/leiningen/foo/foo/LICENSE 
0 12-06-13 10:26 foo/ 
1210 12-06-13 10:26 foo/core$ main.class 
1304 12-06-13 10:26 foo/cores$sfn 16.class 
1492 12-06-13 10:26 foo/cores$loading 4910 auto__.class 
1755 12-06-13 10:26 foo/core.class 
2814 12-06-13 10:26 foo/core_init.class 
162 12-04-13 14:54 foo/core.clj 


23569 14 files 
但 是 ， 如 果 列 出 target/foo-0.1.0-SNAPSHOT-standalone.jar 中 的 文件 ， 会 看 到 超过 3000 个 
文件 `。 
因为 打包 的 pom.xml 文件 包含 了 项 目 依赖 关系 的 列表 ， 所 以 像 Leiningen 或 Maven 这 样 的 
工具 能 自己 解决 这 些 依 赖 关 系 。 这 样 就 能 高 效 地 对 库 进行 打包 。 你 能 想象 每 个 Clojure 库 
都 包含 它 的 全 部 依赖 关系 吗 ? 那 会 是 一 场 带 宽 豆 梦 。 

这 个 特点 ， 在 使 用 Lein deploy 时 ， 部 署 到 远程 储存 地 的 就 是 这 样 精简 的 JAR 。 
因为 不 包含 依赖 关系 (就 是 说 ，Clojure)， 所 以 需要 多 做 一 点 工作 ， 才 能 运行 foo 应 用 。 首 
先 ， 下 载 Clojure 1.5.1 (http://clojure.org/downloads)。 然后 ， 通过 java 命令 调用 foo.core， 
在 classpath 中 带 上 clojure-1.5.1.jar 和 foo-0.1.0-SNAPSHOT.jar (通过 -cp 选项 )。 





























# 下 载 Clojure 

$ wget \ 
http://repol.maven.org/maven2/org/clojure/clojure/1.5.1/clojure-1.5.1.zip 

$ unzip clojure-1.5.1.zip 


# 执行 该 应 用 
$ java -cp target/foo-0.1.0-SNAPSHOT.jar:clojure-1.5.1/clojure-1.5.1.jar \ 
foo.core \ 
123 
Executed with the following args: 1 2 3 


阅 

3.6 节 “ 从 命令 行 运行 程序 ， 了 解 从 Leiningen 运行 Clojure 程序 。 

。 8.1 节 “AOT 编译 ”。 

。 lein-bin (https://github.com/Raynes/lein-bin)， 一 个 Leiningen 插件 ， 生 成 独立 的 控制 台 
可 执行 程序 ， 支 持 OS X、Linux 和 Windows。 





sh 














注 3: 我 们 不 可 能 把 所 有 文件 都 打印 出 来 。 你 用 Lein uberjar && unzip -L target/foo-0.1.0-SNAPSHOT- 
standalone.jar 命令 自己 看 一 下 。 
注 4: 参阅 8.9 六 “向 Clojars 发 布 一 个 库 ”， 了 解 发 布 库 的 更 多 信息 。 
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8.3 创建 WAR 文 件 


作者 : Luke VanderHart 


问题 
希望 将 基于 Ring 开发 的 Clojure Web 应 用 作为 标准 的 Web 档案 (WAR) 文件 ， 部 署 到 常 
用 的 Java EE 容器 中 ， 如 Tomcat、JBoss 或 WebLogic。 


解决 方案 

假定 你 正在 用 Ring 或 基于 Ring 的 框架 〈 例 如 Compojure) ， 要 组 织 项 目 并 构建 WAR 文 
件 ， 最 容易 的 方法 就 是 使 用 Leiningen 的 Lein-ring 播 件 。 假 定 项 目 有 一 个 Ring 处 理 函数 ， 
定义 在 命名 空间 warsample.core 中 ， 像 这 样 : 











(ns warsample.core) 


(defn handler [request] 
{:status 200 
:headers {"content-type" "text/html"} 
:body "<h1i>Hello, world!</h1>"}) 





要 用 lein-ring 来 配置 项 目 ， 请 在 Leiningen 的 project.clj 文件 中 添加 下 面 的 键 值 对 : 
:plugins [[lein-ring "0.8.8"]] 
:ring {:handler warsample.core/handler} 
你 也 需要 确保 应 用 声明 了 对 javax.servlet/servlet-api 库 的 依赖 关系 。 大 多 数 Web 应 用 
库 确 实 包含 传递 的 依赖 关系 ， 可 以 通过 执行 lein deps :tree 来 验证 这 一 点 。 如 果 使 用 的 
其 他 库 没 有 包含 它 ， 你 可 以 自己 包含 它 ， 将 [javax.servlet/servlet-api "2.5"] 添加 到 
project.clj 文件 的 :dependencies 键 中 。 








:plugins 键 指定 项 目 使 用 lein-ring 插件 ，:ring 键 下 面 的 映射 表 指定 了 lein-ring 特定 的 
配置 选项 。 唯 一 必须 的 选项 是 :handter， 它 指明 了 应 用 主要 Ring 处 理 国 数 的 名 称 。 




















lein-ring 为 本 地 运行 应 用 提供 了 方便 的 方法 ， 这 是 为 了 开发 和 测试 。 在 命令 行 ， 只 要 输入 : 
$ lein ring server 


一 个 租 入 式 的 Jetty 服务 器 就 会 启动 ， 为 你 的 Ring 应 用 提供 服务 (默认 在 3000 端口 ， 但 可 
以 在 lein-ring 选项 中 修改 )。 它 也 会 打开 操作 系统 默认 的 浏览 器 ， 浏 览 该 页 。 








在 你 认为 应 用 正确 运行 之 后 ， 就 可 以 用 Lein ring war 或 Lein ring uberwar 命令 来 创建 

















注 5: 如 果 你 没有 类 似 名 称 的 项 目 ， 又 希望 继续 本 实例 ， 就 用 Lein new warsample 创建 一 个 新 项 目 。 
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WAR 文件 。 它 们 都 接受 要 生成 的 WAR 文件 名 作为 参数 : 
$ lein ring war warsample.war 


$ lein ring uberwar warsample-with-deps.war 


lein ring war 创建 的 WAR 文件 只 包含 你 的 应 用 代码 ， 不 包含 传递 的 依赖 关系 ， 而 Lein 
ring uberwar 创建 的 WAR 文件 会 包含 所 有 依赖 关系 的 JAR 文件 。 








这 两 个 命令 都 会 在 创建 WAR 之 前 ， 生 成 必要 的 配置 和 连接 关系 (诸如 WEB-INF 目录 和 
Web.xml 文件 )。 讨 论 小 节 介 绍 了 一 些 可 以 传递 给 Lein ring 的 选项 ， 它 们 将 影响 这 些 组 件 
的 生成 。 


在 发 出 创建 WAR 的 命令 后 ， 你 会 在 项 目的 target 目录 下 发 现 生成 的 WAR 文件 。 这 是 一 
个 相当 普通 的 WAR 文件 ， 可 以 像 标 准 的 JEE WAR 文件 一 样 部 署 。 每 个 应 用 服务 器 都 不 
一 样 ， 所 以 请 查看 你 喜欢 的 系统 的 文档 ， 看 看 如 何 部 署 WAR 文件 。 如 果 你 们 有 运营 团队 
负责 产品 部 署 ， 你 肯定 希望 与 他 们 核对 ， 确 保 遵 守 他 们 的 流程 和 最 佳 实践 。 





























讨论 
要 理解 lein ring war 生成 的 精简 WAR 文件 与 lein ring uberwar 生成 的 “uberwar” 之 间 
的 区 别 ， 以 及 何 时 用 哪 一 个 是 至 关 重 要 的 。 


精简 的 WAR 文件 不 包含 项 目的 依赖 关系 ， 它 只 包含 应 用 自身 的 代码 。 这 意味 着 你 的 程序 
不 能 运行 ， 除 非 你 确保 程序 依赖 的 所 有 JAR 文件 ， 包 括 Clojure 本 身 ， 都 放 在 应 用 的 共享 
类 路 径 中 。 如 何 做 到 这 一 点 取决 于 你 使 用 的 应 用 服务 器 ， 所 以 你 必须 参考 系统 的 文档 ， 确 
定 如 何 提供 它们 。 























“uberwar” 则 不 一 样 ， 它 在 WAR 档案 中 包含 了 程序 依赖 的 所 有 JAR， 它 们 被 作为 绑 定 的 
库 ， 放 在 WEB-INF/lib 目录 下 。 兼 容 的 应 用 服务 器 能 够 在 应 用 自己 的 类 加 载 恬 上 下 文中 运 
行 每 个 应 用 (每 个 部 署 的 WAR 文件 )， 并 将 绑 定 的 JAR 只 提供 给 它们 的 应 用 。 





























通常 ，uberwar 是 比较 安全 的 选择 。 它 让 你 不 必 手 工 管理 库 ， 更 好 地 反映 了 应 用 的 类 路 径 
在 开发 时 的 样子 。 


但 uberwar 的 代价 在 于 ， 一 个 库 如 果 被 多 个 应 用 绑 定 ， 它 可 能 被 加 载 多 次 。 如 果 你 要 运行 
10 个 应 用 ， 假 设 每 个 都 用 到 了 Compojure， 服 务 器 就 会 将 Compojure 加 载 到 JVM 类 空间 
10 次 ， 每 个 应 用 一 次 。 一 些 组 织 机 构 要 求 在 部 署 时 限制 资源 使 用 或 提供 高 性 能 ， 宁 愿 确保 
应 用 的 依赖 关系 中 宛 余 最 小 。 如 果 是 这 样 ， 你 可 能 不 得 不 退 而 使 用 精简 的 WAR 文件， 在 
应 用 服务 器 的 共享 库 中 手工 管理 依赖 关系 。 


















































依赖 关系 冲突 


殉 从 的 和 2H 启用 四 委 澡 对 于 不 同 的 应 用 ， 能 很 好 地 保持 类 路 径 和 绑 定 库 隔 离 ， 尽 
管 如 此 ， 你 必须 注意 一 些 场景 ， 即 应 用 依赖 的 库 属 于 核心 J2EE 平台 ， 例 如 JDBC， 
Servlet API， 像 JAX-*、StAX、JMS 这 样 的 XML 库 ， 等 等 。 


这 些 类 通常 是 由 应 用 服务 器 自己 提供 的 ， 如 果 你 的 应 用 引用 了 它们 ， 这 些 引用 就 会 解 
析 到 容器 提供 的 实例 ， 而 不 是 应 用 绑 定 的 版 本 。 如 果 它 们 完全 一 样 ， 那 很 好 。 但 如 果 
版 本 不 匹配 ， 在 类 的 API 中 引入 了 突破 性 的 变更 ， 你 就 可 能 遇 到 原因 不 明 的 错误 ， 
为 应 用 尝试 调用 的 类 与 它们 构建 时 使 用 的 类 不 同 。 


在 这 种 情况 下 ， 你 需要 调整 应 用 容器 和 应 用 程序 使 用 的 依赖 关系 的 版 本 ， 确 保 它 们 











其 他 lein-ring 选 项 
lein-ring 提供 了 一 些 附加 的 选项 ， 可 以 在 project.clj 文件 的 :ring 配置 映射 表 中 设置 ， 来 
调整 WAR 文件 生成 的 方式 。 完 整 的 描述 请 参考 lein-ring 的 项 目 页 面 (https://github.com/ 


weavejester/lein-ring ) 。 


























表 8-1 列 出 了 一 些 比较 有 用 的 选项 。 


表 8-1: Lein-ring 的 WAR 选 项 
键 描述 默认 值 
:war-exclusions ”一 系列 的 正则 表达 式 ， 指 明 要 排除 在 目标 WAR 之 外 的 所 有 文件 所 有 的 隐藏 文件 
:servlet-class 生成 的 Servlet 类 的 名 字 





T 
































:servlet-name web.xml 中 servlet 的 名 字 处 理 函数 的 名 字 
:url-pattern web.xml 中 servlet 映射 的 URL 让 

:web-xml 使 用 指定 的 web.xml 文件 ， 而 不 是 生成 的 

从 头 开始 创建 WAR 文 件 


如 果 没 有 使 用 Ring， 或 者 有 很 好 的 理由 不 使 用 Lein-ring 插件 ， 你 仍然 可 以 创建 WAR 文 
件 ， 但 创建 过 程 需 要 更 多 手工 工作 。 幸 运 的 是 ，WAR 实际 上 就 是 JAR 文件 ， 只 是 扩展 名 
不 同 ， 并且 包 含 一 些 附加 的 内 部 结构 和 配置 文件 ， 所 以 你 可 以 用 标准 的 lein jar 工具 来 生 
成 ， 只 要 在 档案 中 适当 的 位 置 添 加 下 面 的 文件 。 





























你 也 需要 自 已 定义 一 些 AOT 类 来 实现 javax.servlet.Servlet， 并 让 它们 调用 你 的 Clojure 
应 用 。 然 后 你 需要 通过 部 署 描述 文件 (web.xml) 将 它们 组 织 起 来 ， 交 给 应 用 服务 器 。 


WAR 文件 的 结构 是 : 





<war root> 
- <static resources> 
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|-- NEB-INF 

| - - _ web .xmL 

|-- <app-server-specific depLoyment descriptors> 

|-- Lib 

| |-- <bundled JAR libraries> 

|-- classes 
|-- <AOT compiled .class files for servlets, etc.> 
|-- <.clj source files> 











全 面 解释 这 些 元 素 超 出 了 本 实例 的 范围 。 更 多 的 信息 请 参考 Oracle 的 J2EE 指南 (http:// 
docs.oracle.com/javaee/7/tutorial/doc/packaging003.htm) 中 关于 打包 Web 档案 的 部 分 。 

















其 他 的 Web 服务 器 库 (例如 Pedestal Server) 如 果 包 含 针 对 Leiningen 的 工具 ， 通 常 也 有 创 
建 WAR 文件 的 工具 ， 因 此 请 查看 你 用 的 库 的 文档 。 








参阅 

。 8.1 节 “AOT 编译 ”。 

。 8.2 节 “ 将 项 目 打 包 成 JAR 文件 ”。 

。 lein-ring 的 项 目 页 面 (https://github.com/weavejester/lein-ring)。 

。 Oracle 的 JPEE 指南 (http://docs.oracle.com/javaee/7/tutorial/doc/) 。 


8.4 将 应 用 作为 守护 进程 运行 


作者 : Ryan Neufeld 


望 在 另 一 个 操作 系统 进程 中 ， 将 Clojure 应 用 作为 守护 进程 运行 〈 即 希望 应 用 在 后 台 








解决 方案 

用 Apache Commons Daemon 库 来 编写 应 用 ， 可 以 在 后 台 进 程 中 执行 。Daemon 库 包 含 两 个 
部 分 : Daemon 接口 ， 你 的 应 用 必须 实现 它 ， 以 及 一 个 系统 应 用 “， 它 将 Daemon 兼容 的 应 用 作 
为 守护 进程 运行 。 

首先 在 项 目的 project.clj 文件 中 加 入 Daemon 依赖 关系 。 如 果 还 没有 项 目 ， 就 用 Letn new 
my-daemon 创建 一 个 新 项 目 。 由 于 Daemon 是 基于 Java 的 系统 ， 所 以 先 启用 AOT 编译 ， 
以 便 生 成 类 文件 : 









































注 6: Unix 系统 是 jsvc，Windows 是 procrun。 





(defproject my-daemon "0.1.0-SNAPSHOT" 
:description "FIXME: write description" 
:url "http://example.com/FIXME" 
:license {:name "Eclipse Public License" 
:url "http://www.eclipse.org/legal/epl-v1i0.html"} 
:dependencies [[org.clojure/clojure "1.5.1"] 
[org.apache.commons/commons-daemon "1.0.9"]] 
:main my-daemon.core 
:aot :all) 


要 实现 org.apache.commons.daemon.Daemon 接口 ， 就 在 项 目的 一 个 命名 空间 中 添加 相应 
的 :gen-class 声明 和 接口 函数 。 对 于 最 小 的 函数 式 守 护 进 程 ， 要 实现 -init、-start 和 
-stop。 为 了 得 到 最 佳 结 果 ， 提 供 -main 函数 来 支持 应 用 的 冒 烟 测 试 ， 而 不 去 碰 Daemon 
接口 。 

















(ns my-daemon.core 
(:import [org.apache.commons.daemon Daemon DaemonContext]) 
(:gen-class 
:implements [org.apache.commons.daemon.Daemon])) 


;; 应 用 状态 的 粗略 近似 
(def state (atom {})) 


(defn init [args] 
(swap! state assoc :running true)) 
(defn start [] 
(while (:running @state) 
(println "tick") 
(Thread/sleep 2000))) 


(defn stop [] 
(swap! state assoc :running false)) 


;; Daemon 实现 


(defn -init [this ^DaemonContext context] 
(init (.getArguments context))) 


(defn -start [this] 
(future (start))) 


(defn -stop [this] 
(stop)) 


(defn -destroy [this]) 














;; 支持 命令 行 调用 

(defn -main [& args] 
(init args) 
(start)) 





调用 Leiningen 的 uberjar 命令 ， 打包 所 有 必要 的 依赖 关系 和 生成 的 类 : 








$ lein uberjar 

Compiling my-daemon.core 

Created /tmp/my-daemon/target/my-daemon-0.1.0-SNAPSHOT.jar 

Created /tmp/my-daemon/target/my-daemon-0.1.0-SNAPSHOT-standalone.jar 


在 继续 进行 之 前 ， 先 用 java 来 运行 应 用 ， 对 它 进行 测试 : 


$ java -jar target/my-daemon-0.1.0-SNAPSHOT-standalone.jar 
tick 

tick 

tick 

# 按 Ctrl-C 键 来 终止 混乱 状态 


验证 应 用 工作 正常 后 ， 安 装 jsvce 。 最 后 也 是 最 关键 的 时 刻 ， 将 应 用 作为 守护 进程 运行 ， 即 
用 所 有 必需 的 参数 来 调用 jsvc。 参 数 包括 Java home 目录 的 绝对 路 径 、uberjar、 输 出 日 志 


FE、 你 的 Daemon 实现 所 属 的 命名 空间 `: 





文 伯 





$ sudo jsvc -java-home "$JAVA_HOME" \ 
-Cp "$(pwd)/target/my-daemon-0.1.0-SNAPSHOT-standalone.jar" \ 
-outfile "$(pwd)/out.txt" \ 
my_daemon .core 


# 不 存在 ! 


$ sudo tail -f out.txt 
tick 
tick 
tick 
# 按 CtrL-C 退 日 





# 添加 -stop 标记 以 终止 守护 进程 

$ sudo jsvc -java-home "$JAVA_HOME" \ 
-Cp "$(pwd)/target/my-daemon-0.1.0-SNAPSHOT-standalone.jar" \ 
-stop \ 
my_daemon .core 


如 果 一 切 正常 ，out.txt 将 包含 一 些 “tick”。 守 护 进程 的 设置 有 一 点 难 ， 但 是 一 旦 运行 ， 它 
就 工作 得 很 好 。 如 果 在 用 jsvc 启动 守护 进程 时 遇 到 问题 ， 请 使 用 -debug 标记 ， 输 出 更 详 
细 的 诊断 信息 。 


























你 可 以 在 https://github.com/clojure-cookbook/my-daemon 找到 my-daemon 项 目 
完整 的 、 能 工作 的 副本 。 





注 8: 


: 在 0OS X 上 我 们 建议 用 Homebrew (http://brew.sh/) 来 brew install jsvc。 如 果 使 用 Linux, 你 很 可 能 
会 在 喜欢 的 包 管理 器 中 找到 jsvc 包 。Windows 用 户 需要 安装 并 使 用 procrun (http://commons.apache. 
org/proper/commons-daemon/procrun.html ) 。 


不 要 着 急 ， 我 们 马上 会 在 shell 脚本 中 记 下 这 些 。 
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讨论 

不 要 抱 有 幻想 ， 让 基于 Java 的 服务 作为 守护 进程 是 困难 的 。10 多 年 来 ，Java 开发 者 一 
直 在 用 Apache Commons Daemon 来 做 这 件 事 。 为 什么 要 用 独立 的 Clojure 工具 来 重新 发 
明 轮 子 呢 ? Clojure 的 一 项 核心 力量 就 是 能 够 为 老 曲调 注入 新 生命 ，Daemon 就 是 这 样 的 
“ 老 曲调 ”。 


但 是 ， 并 非 所 有 的 曲调 都 生来 平等 。 虽 然 有 些 Java 库 只 需要 很 少 的 Java 互 操作 ， 但 
Daemon 要 求 很 多 。 利 用 Apache Commons Daemon 让 应 用 作为 守护 进程 ， 需 要 做 对 两 件 
事 。 第 一 件 事 是 创建 一 个 类 来 实现 Daemon 接口 ， 并 将 它 打包 成 JAR 文件 。Daemon 接口 包 
括 4 个 方法 ,分 别 在 守护 进程 应 用 生命 周期 的 不 同时 刻 被 调用 。 





















































init(DaemonContext context) 
在 应 用 初始 化 时 被 调用 。 这 是 设置 应 用 初始 状态 的 地 方 。 

start() 
在 init 之 后 被 调用 。 这 是 开始 执行 工作 的 地 方 。jsvc 希望 start() 快速 完成 ， 所 以 你 
应 该 在 一 个 future 或 Java Thread 中 启动 工作 。 


stop() 
在 守护 进程 被 要 求 停止 时 被 调用 。 在 这 里 应 该 停止 start 中 启动 的 所 有 处 理工 作 。 























destroy() 
在 stop 后 被 调用 ,但 在 JVM 进程 退出 之 前 。 在 传统 的 Java 程序 中 ， 你 会 在 这 里 释放 
所 有 获取 的 资源 。 如 果 你 已 经 正确 地 组 织 了 应 用 的 结构 ， 也 许可 以 在 Clojure 应 用 中 跳 
过 这 一 步 。 通 过 包含 一 个 空 函数 来 防止 jsvc 报 怨 也 没有 什么 关系 。 





























很 容易 创建 一 个 记录 (用 defrecord) 来 实现 Daemon 接口 ， 但 这 还 不 够 。Jsvc 希望 实现 
Daemon 的 类 放 在 类 路 径 中 。 要 做 到 这 一 点 ， 你 必须 做 两 件 事 : 首先 ， 你 需要 让 项 目 采用 事 
先 (AOT) 编译 ,在 project.clj 文件 中 设置 :aot :all 就 可 以 了 。 其 次 ， 你 需要 征用 一 个 命 
名 空间 来 产生 一 个 类 ， 通 过 :gen-class 命名 空间 指令 。 上 有 具体 来 说 ， 你 需要 生成 一 个 类 ， 实 
现 Daemon 接口 。 利 用 :gen-class 和 :implements 指令 ， 这 很 容易 实现 : 




















(ns my-daemon.core 


(:gen-class 
:implements [org.apache.commons.daemon.Daemon])) 





设置 好 my-daemon.core 来 编译 生成 Daemon 实现 类 ， 剩 下 的 事情 就 是 实现 方法 本 身 了 。 在 
国 数 前 加 上 连接 号 (如 -start) 就 是 告诉 Clojure 编译 器 ， 这 个 函数 实际 上 古 一 个 Java 方 
法 。 而 且 ， 由 于 Daemon 的 方法 是 实例 方法 ， 每 个 函数 都 包含 一 个 附加 的 参数 ， 代 表 Daemon 
实例 。 这 个 参数 传统 上 表示 为 this。 
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在 我 们 简单 的 例子 my-daemon 中 ， 大 部 分 方法 实现 都 相当 简单 ， 除 了 this 外 没有 别 的 参 
数 ， 将 工作 代理 给 普通 的 Clojure 函数 。 但 -init 值得 注意 一 下 : 


(defn -init [this ^DaemonContext context] 
(init (.getArguments context))) 


-init 方法 接受 一 个 附加 的 参数 : 一 个 DaemonContext 实例 。 这 个 参数 在 它 的 .getArguments 
属性 中 记录 了 启动 守护 进程 的 命令 行 参数 。 在 实现 时 ，-init 对 context 调用 了 .getArguments 
方法 ， 将 它 的 返回 值 传 递 给 常规 的 Clojure 函数 init。 











为 什么 将 每 个 Daemon 实现 代理 给 独立 的 Clojure 函数 呢 ? 通 过 分 离 Daemon 接口 实现 和 应 用 
的 内 部 工作 ， 你 保留 了 用 其 他 方式 调用 它 的 能 力 。 通 过 这 种 关注 点 分 离 ， 测 试 应 用 就 要 容 
易 得 多 ， 要 么 通过 集成 测试 ， 要 么 直接 调用 。-main 函数 利用 了 这 些 Clojure 函数 ， 让 你 能 
够 在 守护 进程 之 外 ， 验 证 应 用 行为 的 正确 性 。 

做 好 了 Daemon 兼容 应 用 的 基础 工作 ， 剩 下 的 一 步 就 是 对 应 用 打包 。Leiningen 的 uberjar 
命令 完成 了 所 有 必要 的 准备 ， 让 应 用 能 作为 守护 进程 运行 : 将 my-daemon.core 编译 成 类 ， 
收集 依赖 关系 ， 将 它们 打包 成 独立 的 JAR 文件 。 





最 后 一 项 要 点 是 ， 你 需要 运行 它 。 由 于 JVM 进程 通常 在 底层 系统 调用 方面 做 得 不 是 很 好 ， 
所 以 Daemon 提供 了 系统 调用 应 用 ， 即 jsvc 和 procrun ， 作 为 JVM 和 计算 机 操作 系统 的 中 
间 层 。 这 些 应 用 通常 用 C 编写 ， 能 够 执行 相应 的 系统 调用 ， 创 建 一 个 后 台 进 程 来 执行 你 的 
应 用 。 简 单 起 见 ， 我 们 在 本 节 的 剩余 部 分 只 讨论 jsvc 工具 。 


这 两 个 工具 都 有 令 人 迷惑 的 大 量 配 置 选 项 ， 但 只 有 几 个 选项 是 启动 工作 时 真正 需要 的 。 至 
少 ， 你 必须 提供 独立 的 JAR 的 位 置 (-cp)，Java 安装 目录 (-java-home)， 以 及 希望 执行 
的 类 (最 后 一 个 参数 )。 其 他 相关 的 属性 包括 -pidfile、-outfile 和 -errfile， 它 们 分 
别 指定 了 进程 的 ID、STDOUT 和 STDERR 将 写 往 何 处 。 在 类 名 之 后 的 所 有 参数 都 会 传递 给 


-init， 作 为 DaemonContext。 








更 完整 的 例子 是 : 


$ sudo jsvc -java-home "$JAVA_HOME" \ 
-Cp "$(pwd)/target/my-daemon-0.1.0-SNAPSHOT-standalone.jar" \ 
-pidfile /var/run/my-daemon.pid \ 
-outfile "/var/log/my-daemon.out" \ 
-errfile "/var/log/my-daemon.err" \ 
my_daemon.core \ 
"arguments" "to" "my-daemon.core" 


在 用 jsvc 局 动 一 个 守护 进程 后 ， 可 以 通过 重新 运行 jsvc 并 带 上 -stop 选项 
来 停止 它 。 
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由 于 jsvc 在 全 新 的 进程 中 重新 启动 了 你 的 应 用 ， 所 以 它 没有 带 上 原来 的 执行 上 下 文 。 这 意 
味 着 没有 环境 变量 ,没有 当前 工作 目录 ， 什 么 都 没有 。 该 进程 甚至 都 不 是 由 同一 个 用 户 运 
行 的 。 因 此 ， 很 重要 的 是 指定 jsvc 参数 时 带 上 绝对 路 径 ， 并 且 有 正确 的 权限 。 

















例如 ， 我 们 选择 使 用 sudo 来 减少 麻烦 ， 但 在 生产 环境 中 ， 你 应 该 建立 一 个 独立 的 用 户 ， 给 
它 限 制 更 多 的 权限 。 执 行 的 用 户 应 该 有 权限 写 入 .pid、.out 和 .err 文件 ， 并 能 读 取 Java 和 
类 路 径 。 











jsvc 和 类 似 的 工具 可 能 是 变幻 无 常 的 怪兽 ， 因 为 一 点 点 错误 配置 都 可 能 导致 守护 进程 安静 
地 失败 ， 设 有 任何 警告 。 我 们 强烈 建议 在 开发 和 配置 守护 进程 时 使 用 -debug 和 -nodetach 
选项 ， 直 到 你 确信 一 切 工 作 正 常 。 


在 你 确定 合适 的 配置 后 ， 最 后 的 步骤 就 是 写 一 个 守护 进程 脚本 ， 实 现 守护 进程 的 管理 自动 
化 。 好 的 守护 进程 脚本 记录 了 配置 参数 、 文 件 路 径 和 和 常用 操作 ， 并 为 它们 提供 一 个 干净 
的 、 没 有 噪音 的 接口 。 你 可 以 简单 调用 my-daemon start 或 my-daemon stop， 而 不 用 以 
前 执行 的 jsvc 长 命令 。 实 际 上 ， 许多 Linux 发 行 版 都 使 用 类 似 的 脚本 来 管理 系统 守护 进 
程 。 要 实现 你 自己 的 jsvc 守护 进程 脚本 ， 我 们 建议 阅读 Sheldon Neilson 的 文章 “Creating 


a Java Daemon (System Service) for Debian using Apache Commons Jsvc” (http://www.neilson. 




















co.za/creating-a-java-daemon-system-service-for-debian-using-apache-commons-jsvce/) 。 


参阅 

。 Daemon 的 文档 (http://commons.apache.org/proper/commons-daemon/apidocs/index.html)。 

。 jsvc 帮助 手册 的 内 容 ， 通 过 jsvc -help 命令 查看 。 

。 procrun (http://commons.apache.org/proper/commons-daemon/procrun.html), Windows 下 
运行 Daemon 的 工具 。 

。 lein-daemon (https://github.com/arohner/lein-daemon)，Leiningen 的 插件 ， 用 于 创建 守护 
进程 ， 可 以 在 项 目 中 通过 lein daemon 命令 来 管理 。 

。 8.1 三“AOT 编译 ， 了 解 关 于 AOT 编译 的 更 多 信息 。 

。 8.2 市 “将 项 目 打包 成 JAR 文件 ， 了 解 如 何 将 应 用 打包 成 可 执行 的 JAR。 

。 Meikel Brandmeyer 的 博客 文章 “gen-class 一 how it works and how to use it” (https://kotka. 
de/blog/2010/02/gen-class_how_it_works_and_how_to_use_it.html) 。 














。 Stuart Sierra 的 Component 库 (https:Wgithub.comy/stuartsierra/component) , 它 是 一 个 小 框架 ， 


管理 软件 组 件 的 生命 周期 。 


8.5 利用 类 型 暗示 减轻 性 能 问题 


作者 : Ryan Neufeld 
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望 优化 这 些 方法 的 性 能 。 
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解决 方案 
对 于 给 定 函 数 ， 增 加 性 能 最 容易 的 方法 就 是 消除 Java 反射 。 打 开 warn-on-reflection 设置 
来 诊断 过 多 的 反射 


(defn column-idx 
"Return the index number of a column in a CSV header row" 
[header-cols coL] 
(.indexOf (vec header-cols) col)) 


(def headers (clojure.string/split "A,B,C" #",")) 
(column-idx headers "B") 
3 


(set! *warn-on-reflection* true) 


(defn column-idx 
"Return the index number of a column in a CSV header row" 
[header-cols coL] 
(.indexOf (vec header-cols) col)) 
;; Reflection warning, NO_SOURCE_PATH:1:1 - call to indexOf can't be resolved. 


;; 109999 次 无 暗示 的 执行 .…. 
(time (dotimes [_ 100000] (column-idx headers "B"))) 
;; "Elapsed time: 329.258 msecs" 


在 确定 了 反射 之 后 ， 为 参数 列表 添加 类 型 暗示 ， 将 每 个 参数 表示 为 <^Type> <arg>: 


(defn coLumn -idx 
"Return the index number of a column in a CSV header row" 
[^java.util.List header-cols col] 
(.indexOf header-cols col)) 


;; 1099909 次 正确 上 暗示 的 执行 
(time (dotimes [_ 100000] (column-idx headers "B"))) 
;; "Elapsed time: 27.779 msecs" 


如 果 有 一 组 函数 相互 调用 ， 虽 然 你 正确 地 暗示 了 参数 ， 但 还 是 可 能 看 到 反射 警告 。 对 参数 
列表 本 身 也 添加 类 型 暗示 ， 上 暗示 函数 返回 值 的 类 型 : 














;; 作为 一 个 简单 的 例子 ， 假 定 你 想 比 较 两 个 函数 调用 的 结果 








(defn some-calculation [x] 42) 


(defn same-calc? [x y] (.equals (some-calculation x) 
(some-calculation y))) 
;; Reflection warning, NO_SOURCE_PATH:1:24 - call to equals can't be resolved. 
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;; 现在 对 some-calculation 的 返回 值 提供 类 型 暗示 
(defn some-calculation ^Integer [x] 42) 








(defn same-calc? [x y] (.equals (some-calculation x) 
(some-calculation y))) 


;; 看 啊 , 没 有 反射 警告 了 
讨论 
在 高 性 能 代码 中 ， 通 常 你 会 选择 回 退 到 Java 来 增加 性 能 。 但 是 ，Clojure 与 Java 之 间 存 在 
着 阻抗 不 匹配 。Java 是 强 类 型 的 ， 而 Clojure 不 是 。 因 为 这 一 点 ，( 几 乎 ) 每 次 在 Clojure 
中 调用 Java 函数 时 ， 都 需要 对 提供 的 参数 类 型 进行 反射 ， 以 便 选 择 合适 的 Java 方法 来 调 
用 。 对 于 很 少 调用 的 方法 ， 这 不 是 什么 大 事 。 但 对 于 经 常 执行 的 方法 ， 反 射 的 开销 可 能 迅 
速 积累 。 











类 型 暗示 跳 过 了 这 种 反射 。 如 果 你 上 暗示 了 一 个 Java 函数 的 所 有 参数 ，Clojure 编译 器 就 不 
再 执行 反射 。 相 反 ， 函 数 调用 时 会 直接 调用 相应 的 Java 函数 。 当 然 ， 如 果 把 类 型 搞 错 了 ， 
方法 就 不 能 正确 工作 ， 错 误 暗 示 的 函数 会 抛 出 类 型 转换 异常 。 


如 果 你 有 一 系列 的 值 ， 都 是 统一 的 类 型 呢 ? 对 于 这 些 情况 ，Clojure 提供 了 几 种 特殊 的 暗 
示 ， 即 ^ints、^floats、^Longs 和 ^doubles。 了 暗示 这 些 类 型 允许 你 传人 整个 数组 作为 Java 
国 数 的 参数 ， 而 不 用 对 序列 执行 反射 。 























未 检查 的 数学 运算 
你 可 能 注意 到 ，Clojure 对 所 有 的 数字 类 型 也 加 了 额外 检查 ， 目 的 是 避免 溢出 。 当 然 ， 
这 不 是 没有 代价 ， 因 为 Clojure 需要 检查 每 次 操作 ， 确 保 没 有 溢出 。 如 果 你 需要 最 高 性 
能 ， 磺 巧 又 什么 都 不 由， 那么 也 许可 以 试 试 未 检查 的 数学 运算 !。 


将 unchecked-math 设置 为 true， 禁 用 这 种 安全 性 ， 导 致 如 、 减 、 乘 、 除 和 inc/dec 不 
再 检查 溢出 。 这 实际 上 将 数值 运算 回 退 到 了 类 似 C 的 状态 ， 正 整数 溢出 可 能 得 到 一 个 
负数 : 

;; 有 了 检查 的 数学 运算 ， 不 可 能 使 整数 溢出 

(inc Long/MAX_VALUE) 

;; ArithmeticException integer overflow ... 





(set! *unchecked-math* true) 


;; 现在 整数 可 以 自由 溢出 了 
(inc Long/MAX_VALUE) 
;; -> -9223372036854775808 























注 1: 要 准确 测量 unchecked-math 带 来 的 性 能 改进 ， 我 们 建议 使 用 Criterium (https://github.com/hugoduncan/ 
criterium) 这 样 的 工具 。 用 time 的 基准 测试 代码 可 能 很 难处 理 ,常常 得 到 误导 的 结果 (或 根本 没有 结果 )。 
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但 是 ，unchecked-math 不 是 绝对 的 ， 有 可 能 装 箱 的 类 型 (boxed type) 溜 入 到 运算 中 ， 
导致 出 现 检 查 过 的 数学 运算 。 结 合 unchecked-math 和 类 型 暗示 ， 确 保 数 据 运算 真正 是 
未 检查 的 。 当 然 ， 你 自己 要 承担 风险 ! 








。 第 1 章 “ 原 生 数 据 ”。 
。 8.6 市 “用 原生 Java 数组 进行 快速 数学 运算 ”。 


8.6 用 原生 Java 数 组 进 # 


作者 : Jason Wolfe 


dl 
汕 
洲 
站 
Gl 
ul 


问题 
希望 对 大 量 的 数据 执行 快速 的 数学 运算 。 


解决 方案 

原生 Java 数组 是 紧密 存放 大 量 数字 的 规范 方式 ， 并 能 对 它们 进行 快速 运算 〈 常 和 常 比 
Clojure 序列 快 100 倍 )。hiphip (数组 ) 库 (https://github.com/Prismatic/hiphip) 提供 了 快 
速 而 容易 的 方式 ， 来 操作 double、Long、float 或 int 成 员 的 原生 数组 。 














开始 之 前 ， 先 在 项 目 依赖 关系 中 添加 [prismatic/hiphip "0.1.0"]， 或 用 lein-try 启动 REPL， 


$ lein try prismatic/hiphip 





使 用 hiphip 的 一 个 amap 宏 ， 对 有 类 型 的 数组 执行 快速 的 数学 运算 。amap 使 用 了 类 似 
doseq 的 并 行 绑 定 语法 : 


(require 'hiphip.double) 


(defn map-sqrt [xs] 
(hiphip.double/amap [x xs] (Math/sqrt x))) 


(seq (map-sqrt (double-array (range 1000)))) 
;; -> (2.0 3.0 4.0) 


(defn pointwise-product 
"Produce a new double array with the product of corresponding elements of 
xs and ys" 
[xs ys] 
(hiphip.double/amap [x xs y ys] (* x y))) 
(seq (pointwise-product (double-array [1.0 2.0 3.0]) 
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(double-array [2.0 3.0 4.0]))) 
;; -> (2.0 6.0 12.0) 


要 适当 修改 一 个 数组 ， 就 用 hiphip 的 一 个 afill! 宏 : 


(defn add-in-place! 
"Modify xs, incrementing each element by the corresponding element of ys" 
[xs ys] 
(hiphip.double/afill! [x xs y ys] (+ x y))) 


(let [xs (double-array [1.0 2.0 3.0])] 
(add-in-place! xs (double-array [0.0 1.0 2.0])) 
(seq xs)) 


;; -> (1.0 3.0 5.0) 


要 进行 较 快 的 像 reduce 那样 的 操作 ， 就 用 htphip 的 一 个 areduce 和 asum 宏 : 


(defn dot-product [ws xs] 


(hiphip.double/asum [x xs w ws] (* x w))) 


(dot-product (double-array [1.0 2.0 3.0]) 


FE] 


讨论 


(double-array [2.0 3.0 4.0])) 


-> 20.0 





我 们 很 愿意 抛 出 一 个 快速 的 time 基准 测试 ， 来 说 明 获 得 的 性 能 提升 ， 但 对 
于 优化 来 说 ，JVM 是 一 个 变幻 无 常 的 怪兽 。 我 们 建议 用 Criterium (https:// 
github.com/hugoduncan/criterium) 来 进行 基准 测试 ， 避 免 常 见 的 错误 。 








要 了 解 Criterium 对 hiphip 的 基准 测试 ， 请 参见 w0lfe 的 bench.clj 的 要 点 
(https:Wgist.github.com/w01lfe/7132440 ) 。 


大 多 数 时 候 ，Clojure 的 序列 抽象 足以 确保 你 完成 所 有 工作 。 前 面 的 dot-product 能 够 用 普 
通 的 Clojure 简洁 地 写 出 来 ， 一 般 情 况 下 应 该 优先 尝试 : 





(defn dot-product [ws xs] 


但 是 ， 


(reduce + (map * ws xs)) 











且 确 定 瓶颈 是 数学 运算 ， 原 生 数 组 可 能 是 唯一 的 路 。 前 面 的 dot-product 实现 使 





用 asum 后 可 以 快 100 多 倍 ， 这 主要 是 因为 map 产生 了 装 箱 的 Java Double 对 象 的 序列 。 除 
了 构造 中 间 序 列 的 成 本 外 ， 对 装 箱 数 字 的 所 有 数学 运算 都 要 比 相应 的 原生 数字 慢 很 多 。 





hiphip 的 amap、afill!、reduce 和 asum 宏 可 用 于 iint、long、float 和 double 类 型 。 比 方 
说 ， 如 果 希 望 对 浮 点 数组 应 用 reduce， 就 要 用 hiphip.float/reduce。 这 些 宏 对 每 种 类 型 确 
定 了 合适 的 类 型 暗示 和 优化 。 











Clojure 也 带 有 内 建 的 函数 (http:/clojure.orgyjava_interop#Java9620Interop-Arrays) 来 操作 数组 ， 但 
需要 更 加 谨慎 ， 才 能 确保 得 到 最 佳 性 能 (通过 合适 的 类 型 暗示 ， 并 使 用 *unchecked-math*) : 





(set! *unchecked-math* true) 
(defn map-inc [^doubles xs] 
(amap xs i ret (aset ret i (inc (aget xs i1))))) 


尾 





在 Clojure 使 用 原生 数组 不 是 为 了 心中 的 信仰 : 如果 不 做 对 所 有 事情 ， 就 很 容易 得 到 又 丑 、 
又 不 比 简单 的 序列 版 本 快 (其 至 更 慢 ) 的 代码 。 要 注意 的 最 大 问题 是 反射 ， 它 很 容易 把 快 
100 倍 变 成 慢 10 倍 ， 只 要 一 个 小 小 的 打字 错误 或 遗漏 一 个 类 型 暗示 。 





如 果 你 决定 迎接 挑战 ， 应 该 始终 注意 以 下 几 点 : 


。 虑 诚 地 使 用 *warn-on-reflection*， 但 要 注意 它 对 代码 变 慢 的 许多 其 他 原因 不 会 警告 。 

。 可 靠 的 剖析 器 ， 或 者 至 少 是 全 面 的 基准 测试 套件 ， 这 是 必须 的 。 否 则 ， 你 不 会 知道 哪个 
函数 用 了 99% 的 执 4 了 时 间 。 

。 特别 是 如 果 你 没 用 hiphip， 请 尝试 用 *unchecked-math*， 它 几乎 总 是 使 代码 更 快 ， 只 
你 愿意 放弃 溢出 检查 的 安全 性 。 

。 如 果 和 希望 数组 代码 在 Leiningen 下 面 跑 得 快 (https://github.com/technomancy/leiningen/ 
wiki/Faster#tiered-compilation) ， 你 可 以 将 下 面 的 内 容 添 加 到 project.clj 中 : :jvm-opts 


^:replace []. 



































参阅 

。 hiphip 带 有 全 面 的 基准 测试 套件 (https://github.com/Prismatic/hiphip/blob/da72a0bcfffd2 
b34f02ce0fb9fbefc2delfc5d22/test/hiphip/type_impl_test.clj)， 针 对 主要 原生 类 型 ， 测 试 它 
和 Clojure 的 数组 操作 ， 包 括 与 手工 编码 的 Java 替代 程序 的 性 能 比较 。 

。 Vertigo (https://github.com/ztellman/vertigo) 超越 了 简单 的 原生 类 型 数组 ， 采 用 了 完全 
C 风格 的 结构 ， 如 果 你 希望 以 最 佳 的 性 能 操作 结构 化 的 数据 ， 这 可 能 是 一 个 好 选择 ( 例 
如 ， 不 仅 是 double 的 序列 ) 。 

。 8.5 节 利用 类 型 暗示 减轻 性 能 问题 ,了 解 更 多 关于 类 型 暗示 和 未 检查 的 数学 运算 的 内 容 。 

。 8.7 节 “用 Timbre 进行 简单 剖析 ”， 了 解 使 用 Timbre 输出 代码 的 剖析 统计 数据 。 


8.7 用 Timbre 进 行 简单 剖析 


作者 : Ambrose Bonnaire-Sergeant 















































问题 
希望 得 到 关于 代码 运行 时 间 和 调用 次 数 的 细 粒 度 统计 数据 。 








解决 方案 
用 Timbre (https://github.com/ptaoussanis/timbre) 在 代码 中 插入 剖析 宏 ， 并 且 不 会 导致 产品 
环境 中 的 性 能 下 降 。 








开始 之 前 ， 先 在 项 目 依 赖 关系 中 添加 [com.taoensso/timbre "2.6.3"]， 或 用 Lein-try 启动 REPL: 


$ lein try com.taoensso/timbre 





在 开发 时 ， 利 用 taoensso.timbre.profiLing 命名 空间 中 的 宏 来 收集 基准 测试 指标 : 
(require '[taoensso.timbre.profiling :as p]) 


(defn bench-me [f] 
(p/p :bench/bench-me 
(Let [_ (p/p :bench/sleep 
(Thread/sleep 10)) 
n (p/p :bench/call-f-once 
(f)) 
_ (p/p :bench/call-f-10-times-outer 
(dotimes [_ 10] 
(p/p :bench/call-f-10-times-inner 
(f))))] 
(iterate f n)))) 


(p/profile :info :Bench-f 
(bench-me 
(fn ([] (p/p :bench/no-arg-f) 100) 
([a] (p/p :bench/one-arg-f) +)))) 


这 里 我 们 定义 了 一 个 Clojure 函数 bench-me， 它 调用 时 带 上 一 个 高 阶 函 数 f 作为 参数 ，f 接 
受 0 个 或 1 个 参数 。 





Timbre 以 方便 的 表格 形式 输出 丰富 的 剖析 信息 : 


2013-Aug-25 ... Profiling :taoensso.timbre.profiling/Bench-f 
Name Calls Min Max MAD Mean Time% Time 
:bench/bench-me 1 13ms 13ms Ons 13ms 95 13nms 
:bench/sleep 1 1ims 1ims Ons iims 76 1ims 
:bench/call-f-10-times-outer 1 970us 970hs Ons 970hs 7 970hs 
:bench/call-f-once 1 610bhs 610hs Qns 610hs 4 610hs 
:bench/call-f-10-times-inner 10 20hs 214ys 35hs 39Hs 3 394hs 
:bench/no-arg-f 11 Sys 163hs 26Hs ”20hs 2 215Ns 
[Clock] Time 100 14ms 
Accounted Time 186 26ms 


讨论 
用 Timbre 进行 剖析 对 纯 Clojure 来 说 是 极 好 的 解决 方案 。 标准 的 JVM 剖析 工具 ， 如 
YourKit 和 JVisualVM， 提 供 了 关于 Java 方法 的 更 全 面 信 息 ， 但 带 来 的 性 能 开销 也 更 大 。 





























Timbre 对 于 剖析 特定 区 域 的 代码 最 有 用 ， 而 不 是 将 剖析 作为 探索 工具 来 优化 性 能 。 由 于 剖 
析 标 记 只 是 宏 ， 所 以 很 灵活 。 例 如 ， 你 可 以 记录 特定 的 if 分 支 执行 了 多 少 次 ， 完 全 不 需 
要 离开 Clojure， 也 不 必 通 过 YourKit 或 JVisualVM 来 折腾 打 乱 过 的 Clojure 函数 名 字 。 


如 果 觉 得 剖析 很 有 用 ， 就 应 该 保留 在 代码 中 ， 好 的 做 法 是 通过 命名 空间 别名 来 使 用 剖析 
宏 。p 虽然 是 个 方便 的 名 字 ， 但 如 果 不 加 上 明确 的 命名 空间 ， 很 容易 被 本 地 绑 定 掩盖 。 在 
解决 方案 中 ， 我 们 使 用 了 别名 p， 所 以 对 p 的 调用 就 变 成 p/p。 








记 住 ， 在 添加 剖析 语句 时 不 要 犹 泡 : 如果 不 启 用 追踪 ,涉及 taoensso.timbre.profiling/p 
的 代码 不 会 带 来 性 能 损失 。 这 意味 着 你 可 以 将 追踪 代码 留 在 产品 代码 中 。 如 果 以 后 希望 剖 
析 同 一 段 代 码 ， 或 者 希望 剖析 的 注释 让 代码 更 清晰 ， 这 样 做 就 有 好 处 。 








参阅 
。 用 Timbre 剖析 (https://github.com/ptaoussanis/timbre#profiling)。 





8.8 用 Timbre 记 日 志 


作者 : Alex Miller 


问题 


希望 为 应 用 代码 添加 日 志 。 


解决 方案 


用 Timbre (https://github.com/ptaoussanis/timbre) 来 配置 日 志 记 录 ， 为 代码 添加 日 志 信 息 。 





开始 之 前 ， 先 在 项 目 依赖 关系 中 添加 [com.taoensso/timbre "2.7.1"]， 或 用 Lein-try 启动 REPL.: 





$ lein try com.taoensso/timbre 








要 编写 输出 日 志 信 息 的 函数 ， 就 用 Timbre 的 info、error 等 国 数 : 
(require '[taoensso.timbre :as Log]) 


(defn div-4 [n] 
(log/info "Starting") 
(try 
(/ 4 n) 
(catch Throwable t 
(log/error t "oh no!")) 
(finally 
(log/info "Ending")))) 





div-4 半数 接受 一 个 参数 ， 返 回 4/n。 








Log/info 调用 会 生成 一 条 “info” 级 别 的 日 志 输 出 信息 。 类 似 地 ，log/error 调用 将 生成 一 
条 “error” 级 别 的 日 志 输 出 信息 。 传 入 一 个 异常 对 象 作为 第 一 个 参数 ， 将 导致 调用 栈 也 被 
输出 。 


如 果 用 一 些 值 来 调用 dtv-4， 导 致 它 成 功 或 抛 出 错误 ， 就 会 在 REPL 中 看 到 类 似 下 面 的 
输出 : 


(div-4 2) 

;; ->2 

;; *OUt* 

;; 2013-Nov-22 10:34:11 -0500 laptop INFO [user] - Starting 
;; 2013-Nov-22 10:34:11 -0500 laptop INFO [user] - Ending 


(div-4 0) 

;; -> 2013-Nov-22 10:34:47 -0500 laptop ERROR [user] - 

治 oh no! java.lang.ArithmeticException: Divide by zero 
;; -> nil 

OU 

;; 2013-Nov-22 10:34:21 -0500 Laptop INFO [user] - Starting 
;; 2013-Nov-22 10:34:21 -0500 Laptop ERROR [user] - 

> oh no! java.lang.ArithmeticException: Divide by zero 

;; ... Exception stacktrace 

;; 2013-Nov-22 10:34:21 -0500 laptop INFO [user] - Ending 


讨论 
Timbre 是 开始 在 你 的 代码 中 加 入 日 志 的 好 方法 。 使 用 日 志 库 让 你 在 将 来 可 以 指定 输出 去 往 
何 处 ， 可 能 不 止 一 个 目的 地 ， 或 者 对 输出 用 命名 空间 过 滤 。 











Timbre 将 日 志 写 到 配置 的 任意 多 个 “appender”( 输 出 目的 地 ) 中 。 默 认 配置 是 一 个 目的 
地 ， 写 到 标准 输出 。 





例如 ， 要 添加 第 二 个 文件 目的 地 ， 你 可 以 通过 启用 预 配置 的 spit 目的 地 ， 动 态 修改 配置 : 














;; 打开 它 
(log/set-config! [:appenders :spit :enabled?] true) 

;; 设置 日 志文 件 位 置 

(log/set-config! [:shared-appender-config :spit-filename] "out.Log") 





请 注意 ， 输 出 文件 的 目录 必须 存在 ， 并 且 用 户 必须 能 够 写 入 该 文件 。 一 旦 这 个 配置 完成 ， 
日 志 消 息 就 会 被 同时 写 入 控制 台 和 该 文件 。 

可 用 的 日 志 级 别 有 :trace、:debug、:info、:warn、:error 和 :fataL。 默 认 的 日 志 级 别 
是 :debug， 因 此 所 有 级 别 高 于 或 等 于 :debug 的 日 志 都 会 被 记录 (只 有 :trace 是 例外 )。 





要 在 运行 时 改变 日 志 级 别 ， 就 改变 配置 : 
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(log/set-level! :warn) 





对 于 Clojure 应 用 中 的 简单 日 志 来 说 ， 虽 然 Timbre 是 个 优秀 的 库 ， 但 如 果 你 要 与 许多 Java 
库 集成 ， 那 它 可 能 还 不 够 。 存 在 各 种 流行 的 Java 日 志 框 架 和 日 志 包 装 库 。 如 果 希 望 利 用 已 
有 的 Java 日 志 基 础 设施 ， 你 可 能 会 发 现 tools.1logging 框架 更 合适 。 























参阅 
。 Timbre 的 Readme (https://github.com/ptaoussanis/timbre/blob/master/README.md)。 
。 用 tools.logging 记录 日 志 《https://github.com/clojure/tools.logging/blob/master/README.md)。 


8.9 ”向 Clojars 发 布 库 


作者 : Ryan Neufeld， 最 初 由 Simon Mosciatti 提交 





问题 
你 用 Clojure 构建 了 一 个 库 ， 希望 发 布 给 全 世界 。 


解决 方案 
发 布 库 最 容易 的 地 方 就 是 Clojars (https:Wclojars.org/) ， 它 是 针对 开源 库 的 社区 代码 库 。 开 
始 之 前 ， 先 注册 一 个 账号 (https://clojars.org/register)。 如 果 你 还 没有 SSH 键 ， 那 么 GitHub 
上 的 指南 “Generating SSH Keys” (https://help.github.com/articles/generating-ssh-keys) 就 是 
很 好 的 资源 。 


注册 账号 后 ， 你 就 可 以 发 布 基于 Leiningen 的 项 目 了 。 如 果 还 没有 要 发 布 的 项 目 ， 就 用 
lein new my-first-project-<firstname>-<Lastname> 生成 一 个 ， 用 你 自己 的 名 称 替 换 


<firstname> 和 <Lastname>。 

















现在 可 以 用 Lein deploy clojars 命令 ， 将 你 的 库 发 布 到 Clojars 上 : 





$ lein deploy clojars 
WARNING: please set :description in project.clj. 
WARNING: please set :url in project.clj. 
No credentials found for clojars (did you mean ‘lein deploy clojars'?) 
See “lein help deploy. for how to configure credentials. 
Username: # ©@ 
Password: # @ 
Wrote .../my-first-project-ryan-neufeld/pom.xml 
Created .../my-first-project-ryan-neufeld-0.1.0-SNAPSHOT.jar 
Could not find metadata my-first-project-ryan-neufeld: 
.../0.1.0-SNAPSHOT/maven-metadata.xmL \ 
in clojars (https://clojars.org/repo/) 
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Sending .../my-first-project-ryan-neufeld-0.1.0-20131113.123334-1.pom (3k) 
to https://clojars.org/repo/ 

Sending .../my-first-project-ryan-neufeld-0.1.0-20131113.123334-1.jar (8k) 
to https://clojars.org/repo/ 

Could not find metadata my-first-project-ryan-neufeld:.../maven-metadata.xml \ 
in clojars (https://clojars.org/repo/) 

Sending my-first-project-ryan-neufeld/.../0.1.0-SNAPSHOT/maven-metadata.xml (1k) 
to https://clojars.org/repo/ 

Sending my-first-project-ryan-neufeld/.../maven-metadata.xml (1k) 
to https://clojars.org/repo/ 


@ 输入 你 的 Clojars 用 户 名 ， 然 后 回 车 。 
@ 输入 你 的 Clojars 口令 ， 然 后 回 车 。 





在 这 个 命令 完成 后 , 你 的 库 既 可 以 在 Web 上 访问 (https://clojars.org/my-first-project-ryan-neufeld)， 
也 可 以 作为 Leiningen 的 依赖 关系 ([my-first-project-ryan-neufeld "0.1.0-SNAPSHOT"])。 


讨论 
发 布 一 个 库 不 会 比 这 更 简单 了 ， 只 要 创建 一 个 账户 并 按 下 “大 红 按 钮 ”。Leiningen 和 
Clojars 共同 使 它 变 得 非常 容易 ， 像 你 一 样 的 Clojure 社区 开发 者 可 以 向 大 家 发 布 他 们 的 库 


在 这 个 例子 中 ， 你 发 布 一 个 简单 的 、 唯 一 命名 的 库 ， 不 太 注 意 版 本 、 发 布 策略 ， 也 没有 足 
够 的 元 数据 。 在 真正 的 项 目 中 ， 应 该 注意 这 些 事情 ， 成 为 开源 世界 的 好 公民 。 
最 容易 的 改变 是 添加 合适 的 元 数据 和 一 个 网 站 。 在 你 的 projectcj 文件 中 ， 添 加 准确 


的 :description 和 :url。 如 果 你 的 项 目 没 有 网 站 ， 请 考虑 连接 到 项 目的 GitHub 页 面 (或 
其 他 公共 SCM 的 “项 目 页 面 ”)。 




















o 























较 难 的 是 让 项 目 有 一 致 的 版 本 号 。 我 们 建议 的 策略 是 语义 版 本 (Semantic Versioning， 
http:/semver.org/) ， 简 称 semver。 这 种 策略 用 3 个 部 分 来 描述 版 本 ， 即 主 版 本 、 次 版 本 和 
补丁 ， 用 句点 连接 。 结 果 就 像 “0.1.0” 或 “1.4.2?。 每 个 版 本 位 置 表 明 一 定 层 次 的 稳定 性 
以 及 跨 发 行 版 的 一 致 性 。 相 同 主 版 本 号 的 发 行 版 应 该 是 API 兼容 的 ， 升 级 主 版 本 号 就 是 说 
“我 已 经 从 根本 上 改变 了 这 个 库 的 APT 。 次 版 本 号 变化 表明 已 经 添加 了 一 些 新 的 、 向 后 兼 
容 的 功能 。 最 后 ， 补 丁 号 表明 一 些 缺 陷 得 到 修正 。 


















































遵守 语义 版 本 肯定 需要 自觉 ， 这 样 做 的 好 处 是 追随 你 的 开发 者 比较 容易 理解 库 的 版 本 ， 相 
信和 它们 的 行为 是 符合 预期 的 。 


代码 签名 是 部 署 过 程 中 的 另 一 项 重要 考虑 。 对 发 布 的 文件 签名 ， 让 用 户 知道 这 些 文件 是 由 
他 们 信任 的 人 【你 ) 创建 的 ， 包 含 的 就 是 你 的 意图 〈( 即 它们 疫 有 被 自 改 ) 。Leiningen 包含 
了 用 GPG 对 发 布 的 文件 签名 的 机 制 ， 并 在 lein deploy 发 布 时 ， 包 含 了 相关 的 .asc 签名 
文件 。 启 用 代码 签名 在 Leiningen 的 部 署 库 指 南 (https:Wgithub.com/technomancy/leiningen/ 
blob/stable/doc/DEPLOY.md#gpg) 的 “GNU Privacy Guard ”(GPG) 节 中 介绍 。 
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参阅 
。 Clojars 的 维基 页 面 (https://github.com/ato/clojars-web/wiki)， 包 含 了 大 量 关于 向 Clojars 
发 布 库 的 信息 。 

Leiningen 的 部 署 库 指南 (https://github.com/technomancy/leiningen/blob/master/doc/DEPLOY. 
md)， 介 绍 了 代码 签名 ， 以 及 如 何 向 Clojars 之 外 的 地 方 部 署 库 。 

。 lein help deploy 命令 的 输出 。 


8.10 ”使 用 宏 来 简化 API 弃 用 


作者 : Michael Fogus 


























问题 
希望 用 Clojure 宏 来 弃 用 API 函数 ， 并 报告 现 有 的 充 用 信息 。 


解决 方案 

如 有 果 其 他 程序 员 完 成 工作 时 依赖 你 维护 的 库 ， 你 在 进行 变更 时 理应 深思 熟 虑 。 在 修复 缺陷 
和 改进 库 的 过 程 中 ， 你 最 终 会 希望 改变 它 的 公共 接口 。 对 库 中 面向 公众 的 部 分 进行 修改 ， 
这 不 是 件 小 事 ， 但 假定 你 确信 必须 这 样 做 ， 那 么 你 会 希望 弃 用 一 些 过 时 的 函数 。 术 语 “ 弃 
用 ”基本 上 意味 着 某 个 函数 应 该 避免 使 用 ， 代 之 以 另外 的 新 函数 。 









































例如 ， 以 Clojure 的 贡献 库 core.memoize (https://github.com/clojure/core.memoize) 为 例 。 
不 必 深 入 了 解 core.memoize 做 了 些 什么 ， 只 要 知道 在 革 一 个 时 刻 ， 它 的 面向 公众 的 API 是 
一 个 名 为 nemo-fifo 的 函数 ， 看 起 来 像 这 样 : 





(defn memo-fifo 
([f] ... ) 
([f limit] ... ) 
([f limit base] ... )) 





显然 ， 实 现 已 经 被 省 略 ， 只 突出 后 面 的 版 本 计划 修改 的 部 分 ， 即 该 函数 的 名 称 和 可 用 的 参 
数 向 量 。 新 API 的 细节 并 不 重要 ， 但 它们 的 差异 足以 引起 用 户 的 迷惑 。 在 这 种 情况 下 ， 如 
果 在 新 版 本 中 仅仅 进行 修改 而 不 提供 适当 的 通知 ， 就 不 是 好 方式 ， 真 的 会 导致 痛苦 。 

随 之 而 来 的 问题 是 ， 如 采 一 项 功能 计划 要 弃 用 ， 既 需要 临时 支持 原 有 的 代码 ， 又 要 警告 库 
的 用 户 将 来 会 有 突破 性 变化 ， 你 该 怎么 做 ? 在 本 节 中 ， 我 们 将 探讨 利用 安 来 提供 一 种 很 好 
的 机 制 ， 以 最 小 的 代价 ， 弃 用 库 的 功能 和 宏 。 


例如 计划 弃 用 的 memo-fifo， 新 的 函数 名 字 就 叫 fifo， 不 仅 需 要 改变 名 称 ， 也 要 改变 参数 
数目 。 在 弃 用 库 中 某 些 部 分 时 ， 最 好 是 打印 出 警告 信息 ， 指 出 新 的 、 更 为 理想 的 替代 函 
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数 。 因 此 ， 为 了 弃 用 memo-fifo， 先 创建 下 面 的 函数 !!， 来 打印 警告 信息 : 


(defn ^:private !! [c] 
(println "WARNING - Deprecated construction method for" 
C 
"cache; preferred way is:" 
(str "(clojure.core.memoize/" c 
" function <base> <:" 
c "/threshold num>)"))) 





传 入 一 个 符号 时 ，!! 函数 打印 出 这 样 的 信息 : 
(11 'fifo) 


;; WARNING - Deprecated construction method for fifo cache; 
;; preferred way is: 
;; (clojure.core.memoize/fifo function <base> <:fifo/threshold num>) 


弃 用 信息 不 仅 指出 调用 的 函数 被 弃 用 了 ， 也 指出 了 应 该 使 用 的 替代 函数 。 对 弃 用 消息 来 说 ， 
这 已 经 很 实在 了 ， 虽 然 你 的 目的 可 能 是 别 的 东西 。 不 管 怎样 ， 为 了 在 每 次 调用 memo-fifo 
时 插入 这 条 敬告， 我 们 可 以 创建 一 个 简单 的 宏 ， 在 函数 定义 体 中 插入 对 !! 的 调用 ， 像 这 样 : 











(defmacro defn-deprecated [nom _ alt ds & arities] 
‘(defn ~nom ~ds ;0 
~@(for [[args body] arities] ;@ 
(list args ‘(!! (quote ~alt)) body)))) ;© 





@ 创建 defn 调用 ， 带 上 给 定 的 名 称 和 文档 字符 串 。 
名 对 给 定 函数 参数 列表 进行 循环 。 
@ 在 函数 体 开始 的 位 置 插 入 对 !! 的 调用 。 





我 们 会 在 后 面 的 讨论 环节 探讨 defn-deprecated 宏 的 目的 ， 但 现在 ， 你 可 以 看 到 它 是 怎么 
工作 的 : 





(defn-deprecated memo-fifo :as fifo 
"DEPRECATED: Please use clojure.core.memoize/fifo instead." 
([f] ... ) 
([f limit] ... ) 
([f limit base] ... ) 





对 于 memo-fifo 的 定义 ， 仅 有 的 改变 是 使 用 defn-deprecated 宏 代 末了 defn， 使 用 了 :as 
fifo 指令 ， 并 增加 (或 改变 ) 了 文档 字符 串 来 描述 弃 用 。defn-deprecated 宏 人 负责 组 装 宏 
体 的 各 个 部 分 ， 在 使 用 时 打印 出 警告 ; 





(def f (memo-fifo identity 32)) 

;; WARNING - Deprecated construction method for fifo cache; 

;; preferred way is: 

;; (clojure.core.memoize/fifo function <base> <:fifo/threshold num>) 
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每 次 调用 memo-fifo 时 ， 警 告 信息 只 会 显示 一 次 ， 由 于 该 函数 的 性 质 ， 这 应 该 够 了 。 


讨论 
除了 用 宏 之 外 ， 还 有 一 些 不 同 的 方法 来 处 理 这 种 情况 。 例 如 ，!! 函数 可 以 接受 一 个 函数 和 
一 个 符号 作为 参数 ， 包 装 该 函数 ， 插 入 弃 用 的 警告 信息 : 


(defn depr [fun alt] 
(fn [& args] ;0 
(println 
"WARNING - Deprecated construction method for" 
alt 
"cache; preferred way is:" 
(str "(clojure.core.memoize/" alt 
" function <base> <:" 
alt "/threshold num>)")) 
(apply fun args))) ;@ 


@ 在 调用 弃 用 的 函数 之 前 ， 先 返回 一 个 函数 打印 弃 用 信息 。 
@@ 调用 弃 用 的 函数 。 
这 个 !! 的 新 实现 将 以 这 种 方式 工作 : 








(def memo-fifo (depr old-memo-fifo 'fifo)) 

















此 后 ， 调 用 memo-fifo 函数 将 打印 出 弃 用 信息 。 像 这 样 使 用 高 阶 函 数 是 一 种 合理 的 方式 ， 
目的 是 避免 使 用 宏 的 六 在 复杂 性 。 但 是 ， 出 于 某 些 原因 ， 我 们 选择 使 用 宏 的 版 本 ， 后 续 小 
市 将 解释 。 

保持 调用 栈 

说 实话 ，Clojure 产生 的 异常 调用 栈 有 时 候 可 能 令 人 痛苦 。 如 果 你 决定 使 用 depr 这 样 的 高 
阶 函 数 ， 就 要 注意 ， 如 果 执 行 时 产生 异常 ， 就 会 另外 加 一 层 调用 栈 。 使 用 ! 这 样 的 宏 ， 
将 操作 直接 代理 给 defn， 就 可 以 确保 调用 栈 不 会 摊 杂 〈 可 以 这 么 说 ) 。 

元 数据 

使 用 像 defn-deprecated 这 样 近乎 一 对 一 的 替换 安 ， 让 你 保持 函数 的 元 数据 。 请 看 : 























(defn-deprecated ^:private memo-foo :as bar 
"Does something." 


([] 42)) 


(memo-foo) 

;; WARNING - Deprecated construction method for bar cache; 

;; preferred way is: 

;; (clojure.core.memoize/bar function <base> <:bar/threshold num>) 
;;=> 42 





因为 defn-deprecated 将 它 的 部 分 行为 延迟 到 defn， 所 以 它 的 元 素 上 附着 的 所 有 元 数据 都 
自动 传递 下 去 ， 像 期 望 的 一 样 : 

(meta #'memo-foo) 

;;=> {:arglists ([]), :ns #<Namespace User>， 

:name memo-foo, :private true, :doc "Does something.", 

二 
使 用 高 阶 函 数 的 方式 不 会 自动 保持 元 数据 : 


(def baz (depr foo 'bar)) 





(meta #'baz) 
;;=> {:ns #<Namespace user>, :name baz, ...} 


当然 ， 如 果 有 必要 ， 你 可 以 复制 元 数据 ， 但 如 果 宏 的 方式 能 替 你 做 到 ， 为 什么 还 要 这 么 
做 呢 ? 





更 快 的 调用 现场 

depr 函数 由 于 需要 处 理 你 给 它 的 任意 函数 ， 所 以 在 内 部 需要 使 用 appty。 虽 然 在 core. 
memoize 函数 的 例子 中 这 不 是 问题 ,但 对 于 要 求 更 高 性 能 的 函数 ， 这 可 能 成 为 问题 。 不 过 
在 实际 中 ， 使 用 printtn 可 能 超过 apply 的 代价 ， 所 以 如 果 你 真 需要 弃 用 一 个 高 性 能 函数 ， 
可 能 需要 考虑 下 面 的 方法 。 


编译 时 警告 

defn-deprecated 的 操作 方式 ， 是 在 函数 每 次 调用 时 打印 出 弃 用 信息 。 如 果 函 数 要 求 很 高 的 
速度 ， 这 可 能 会 有 问题 。 很 少 有 比 控制 台 打 印 更 影响 函数 速度 的 东西 。 因 此 ， 你 可 以 稍稍 
改变 defn-deprecate， 让 它 在 编译 时 报警 ， 而 不 是 在 运行 时 。 






































(defmacro defn-deprecated [nom _ alt ds & arities] 
(!! alt) ;0 
‘(defn ~nom ~ds ~@arities)) ; @ 


@ 在 访问 宏 时 打印 警告 信息 。 
@ 将 函数 定义 代理 给 defn， 不 作 挨 杂 。 




















请 看 编译 时 的 警告 : 


(defn-deprecated ^:private memo-foo :as bar 
"Does something." 


([] 42)) 


;; WARNING - Deprecated construction method for bar cache; 

;; preferred way is: 

;; (clojure.core.memoize/bar function <base> <:bar/threshold num>) 
;;=> #'User/memo-foo 
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(memo-foo) 
42 


如 果 你 发 行 的 库 是 作为 源 代码 ， 而 不 是 作为 编译 好 的 程序 ， 这 种 方法 将 会 很 有 效 。 

关闭 它 

宏 真正 的 优美 之 处 不 是 它们 允许 你 改变 程序 的 语义 ， 而 是 它们 允许 你 在 不 合适 的 时 候 ， 避 
免 这 样 做 。 例 如 ， 如 果 使 用 宏 ， 你 可 以 在 编译 时 运行 所 有 Clojure 可 用 的 代码 。 非 常 感谢 ， 
整个 Clojure 语言 在 编译 时 都 可 用 。 因 此 ， 我 们 可 以 检查 作为 元 数据 附着 在 命名 空间 上 的 
布尔 标记 ， 决 定 是 否 报 告 编译 时 的 弃 用 信息 。 我 们 可 以 修改 最 新 的 defn-deprecated， 来 展 
示 这 种 技巧 : 


























(defmacro defn-deprecated 
[nom _ alt ds & arities] 
(Let [silence? (:silence-deprecations (meta clojure.core/*ns*))] ; © 
(when-not silence? ; © 
(!! alt))) 


‘(defn ~nom ~ds ~@arities)) 


@ 查看 当前 命名 空间 的 元 数据 。 
@ 只 在 标记 没有 被 设置 为 silence 模式 时 ， 报 告 弃 用 警告 。 








defn-deprecated 宏 检 查 了 当前 命名 空间 中 :silence-deprecations 元 数据 属性 的 状态 ， 根 
据 它 决定 是 否 报 告 弃 用 警告 。 如 果 最 终 使 用 了 这 种 方式 ， 那 么 就 可 以 对 命名 空间 关闭 弃 用 
警告 ， 只 要 在 ns 声明 中 添加 下 面 的 内 容 : 











(ns ^:silence-deprecations my.awesome.Lib) 


现在 ， 在 该 命名 空间 使 用 defn-deprecated 就 不 会 打印 出 警告 。 将 来 版 本 的 Clojure 会 提供 
更 清晰 的 方式 ， 来 创建 和 管理 编译 时 的 标记 ， 但 现在 这 是 一 种 体面 的 折 中 。 























参阅 
。 官方 宏文 档 (http://clojure.org/macros)。 








第 9 章 


分 布 式 计算 





9.0 简介 


由 于 存储 器 越 来 越 便宜 ， 我 们 倾向 于 存储 越 来 越 多 的 数据 。 也 由 于 数据 量 不 断 增 加 ， 充 分 
利用 它们 变 得 越 来 越 困 难 。 因 此 ， 过 去 十 年 出 现 了 无 数 新 技术 ， 来 处 理 如 此 大 量 的 数据 。 











本 章 主要 关注 其 中 一 种 技术 ， 即 MapReduce (http://research.google.com/archive/mapreduce. 
html) ， 它 是 Google 在 本 世纪 初 发 展 起 来 的 。 这 种 技术 从 名 字 上 看 就 是 函数 式 的 ， 它 在 多 
个 机 器 上 并 行使 用 map 和 reduce， 规 模 很 大 ， 以 惊人 的 速度 处 理 数据 。 在 本 章 中 ， 我 们 将 
介绍 Cascalog (http://cascalog.org/)， 它 是 在 Hadoop (http://hadoop.apache.org/) 基础 上 建 
立 的 数据 处 理 库 。Hadoop 是 开源 的 MapReduce 实现 。 








我 们 也 会 简单 介绍 Storm (http:/storm-projectneV) ， 它 是 一 个 实时 的 流 处 理 库 ， 被 Twitter、 
Groupon 和 Yahool 等 技术 巨头 采用 。 


Cascalog 


Cascalog 基于 Datalog 定义 了 一 个 DSL，Datalog 是 支持 Datomic (http://www.datomic.com/) 
的 查询 语言 。 初 看 起 来 它 可 能 有 点 奇怪 ， 但 你 很 快 就 能 用 Datalog 来 思考 。 尝 试 过 这 些 实 
例 后 ， 请 访问 Cascalog 的 维基 页 面 (https:Wgithub.com/nathanmarz/cascalog/wiki) ， 了 解 更 
多 的 信息 ， 以 编写 自己 的 查询 。 








Cascalog 提供 了 简明 的 语法 来 描述 数据 处 理工 作 。 转 换 和 聚合 在 Cascalog 中 很 容易 表示 ， 
连接 特别 简单 。 你 可 能 会 非常 喜欢 Cascalog 的 语法 ， 甚 至 在 本 地 任务 中 使 用 它 。 
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你 可 以 用 几 种 不 同 的 方式 执行 Cascalog 任务 。 最 容易 的 方式 就 是 在 本 地 执行 任务 。 如 果 这 
样 做 ，Cascalog 会 使 用 Hadoop 的 本 地 模式 ， 在 你 自己 的 计算 机 上 完成 整个 任务 。 这 样 既 
享受 到 并 行 的 好 处 ， 又 省 去 了 建立 集群 的 麻烦 。 


一 旦 你 的 任务 超出 了 本 地 模式 ， 就 需要 将 它们 运行 在 Hadoop 集群 上 。 拥 有 自己 的 集 
群 有 很 多 乐趣 ， 但 建立 和 维护 它 需 要 大 量 的 工作 (和 金钱! )。 如 果 你 不 是 经 常用 到 集 
群 ， 可 以 考虑 将 任务 运行 在 Amazon Elastic MapReduce (EMR,， http://aws.amazon.com/cn/ 
elasticmapreduce/) 上 。EMR 提供 了 按 需 计算 的 Hadoop 集群 ， 就 像 EC2 提供 按 需 服务 器 
一 样 。 你 需要 有 Amazon Web Services 账户 来 运行 任务 ， 但 这 并 不 困难 。 稍 后 在 9.7 节 “ 在 
弹性 MapReduce 上 运行 Cascalog 任务 ”中 ， 你 会 看 到 具体 怎么 做 。 无 论 是 在 EMR 或 自己 
的 集群 上 运行 任务 ， 你 都 要 将 代码 打包 成 uberjar (参阅 8.2 节 )， 然 后 将 它 发 送 给 Hadoop 
执行 。 让 几 百 个 计算 机 为 你 的 任务 而 工作 ， 简 单 得 让 人 吃惊 。 


9.1 用 Storm 构 建 活动 推送 系统 


作者 : Travis Vachon 















































希望 构建 一 个 活动 流 处 理 系 统 ， 以 便 对 应 用 用 户 生 成 的 原始 事件 数据 进行 过 滤 和 聚合 。 


解决 方案 

流 是 向 现代 因特网 用 户 展示 信息 的 一 种 主要 隐喻 。 它 被 Facebook 和 Twitter 这 样 的 站 点 以 
及 Instagram 和 Tinder 这 样 的 移动 应 用 所 采用 。 它 是 一 种 优雅 的 工具 ， 为 用 户 提 供 了 一 个 
窗口 ， 查 看 他 们 每 天 使 用 的 应 用 所 产生 的 信息 洪流 。 


作为 这 些 应 用 的 开发 者 ， 你 需要 工具 来 处 理 用 户 动作 所 产生 的 原始 事件 数据 。 这 些 工具 必 
须 提供 过 滤 与 聚合 数据 的 强大 能 力 ， 必 须 能 够 任意 伸缩 ， 给 不 断 增长 的 用 户 提 供 服务 。 在 
理想 情况 下 ， 它 们 应 该 提供 高 层 抽象 ， 帮 助 你 组 织 和 发 展 复杂 的 流 处 理 逻 辑 ， 以 适应 新 的 
特征 和 复杂 的 世界 。 

































































Clojure 在 Storm (http://storm-project.net/) 中 提供 了 这 样 的 工具 。Storm 是 一 个 分 布 式 实时 
计算 系统 ， 目 的 是 能 够 实时 计算 Hadoop 需要 分 批 计 算 的 任务 。 在 本 节 中 ， 你 将 构建 一 个 
简单 的 活动 流 处 理 系 统 ， 它 能 够 容易 地 扩展 ， 以 解决 许多 现实 问题 。 








首先 ， 用 Leiningen 模板 创建 一 个 新 的 Storm 项 目 (http://storm.incubator.apache.org/) : 
$ lein new cookbook-storm-project feeds 


在 项 目 目录 中 ， 运 行 默 认 的 Storm 拓扑 结构 〈 它 已 由 Lein 模板 生成 ) : 
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$ cd feeds 
$ Lein run -m feeds.topology/run! 
Compiling feeds.TopoLogySubmitter 


Emitting: spout default [:bizarro] 
Processing received message source: spout:4, stream: default, id: {}, [:bizarro] 
Emitting: stormy-bolt default ["I'm bizarro Stormy!"] 
Processing received message source: stormy-bolt:5, 
stream: default, id: {}, [I'm bizarro Stormy!] 
Emitting: feeds-bolt default ["feeds produced: I'm bizarro Stormy!"] 


r 





这 个 生成 的 示例 拓扑 结构 只 是 不 连贯 地 胡乱 发 出 示例 消息 ， 这 也 许 不 是 你 想 要 的 ， 所 以 开 
始 要 修改 “喷嘴 ”(spout) ， 以 便 产 生 真实 的 事件 。 








按照 Storm 的 说 法 ,“ 喷 嘴 ” 是 一 个 组 件 ， 它 将 数据 插入 到 处 理 系统 中 ,创建 一 个 数据 流 。 
打开 src/feeds/spouts.cj ， 用 新 的 “喷嘴 ”替换 掉 defspout 形式 ， 它 将 定期 产生 随机 的 用 户 
事件 ， 就 像 人 们 在 在 线 商 店 中 看 到 的 一 样 〈 当 然 ， 在 真正 的 应 用 里 ， 你 会 将 它 挂 接 到 某 个 
真正 的 数据 源 ， 而 不 是 随机 数据 生成 器 ) : 


























(defspout event-spout ["event"] 
[conf context collector] 
(let [events [{:action :commented, :user :travis, :listing :red-shoes} 
{:action :liked, :user :jim, :listing :red-shoes} 
{:action :liked, :user :karen, :listing :green-hat} 
{:action :liked, :user :rob, :listing :green-hat} 
{:action :commented, :user :emma, :listing :green-hat}]] 
(spout 
(nextTuple [] 
(Thread/sleep 1000) 
(emit-spout! collector [(rand-nth events)]))))) 





接 下 来 ,打开 src/feeds/bolts/cljj。 添 加 一 个 螺栓 (bolt) ， 它 接受 一 个 用 户 和 一 个 事件 ， 为 系 
统 中 的 每 个 用 户 产生 一 个 (user，event) 元 组 。 螺 栓 消 费 一 个 流 ， 进 行 某 种 处 理 ， 然 后 产 
生 一 个 新 流 : 








(defbolt active-user-bolt ["user" "event"] [{event "event" :as tuple} coLLector] 
(doseq [user [:jim :rob :karen :kaitlyn :emma :travis]] 
(emit-bolt! collector [user event])) 
(ack! collector tuple)) 








现在 添加 一 个 螺栓 ， 它 接受 一 个 用 户 和 一 个 事件 ， 当 且 仅 当 该 用 户 关 注 了 触发 该 事件 的 用 
户 时 ， 它 才 产 生 一 个 元 组 : 





(defbolt follow-bolt ["user" "event"] {:prepare true} 
[conf context collector] 
(let [follows {:jim #{:rob :emma} 
:rob #{:karen :kaitlyn :jim} 
:karen #{:kaitlyn :emma} 
:kaitlyn #{:jim :rob :karen :kaitlyn :emma :travis} 
:emma #{:karen} 
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:travis #{:kaitlyn :emma :karen :rob}}] 
(bolt 
(execute [{user "user" event "event" :as tuple}] 
(when ((follows user) (:user event)) 
(emit-bolt! collector [user event])) 
(ack! collector tupLe) )))) 








最 后 ， 再 添加 一 个 螺栓 ， 它 接受 一 个 用 户 和 一 个 事件 ， 将 事件 保存 在 一 个 集 的 散 列 中 ， 就 


像 {:userl #{event1 event2} :user2 #{fevent1 event2}}。 这 是 你 要 展示 给 用 户 的 活动 流 : 














(defbolt feed-bolt ["user" "event"] {:prepare true} 
[conf context collector] 
(let [feeds (atom {})] 
(bolt 
(execute [{user "user" event "event" :as tuple}] 
(swap! feeds #(update-in % [user] conj event)) 
(println "Current feeds:") 
(clojure.pprint/pprint @feeds) 
(ack! collector tuple))))) 





这 给 出 了 所 有 需要 的 组 件 ， 但 你 还 需要 将 它们 组 装 成 一 个 计算 拓扑 结构 。 打 开 src/feeds/ 
topology.cj ， 利 用 拓扑 结构 DSL， 将 喷嘴 和 螺栓 连接 在 一 起 。 








(defn storm-topology [] 
(topology 
{"events" (spout-spec event-spout)} 


{"active users" (bolt-spec {"events" :shuffle} active-user-bolt :p 2) 
"follows" (bolt-spec {"active users" :shuffle} follow-bolt :p 2) 
"feeds" (bolt-spec {"follows" ["user"]} feed-bolt :p 2)})) 


你 还 需要 更 新 文件 中 的 :require 语句 : 


(:require [feeds 
[spouts :refer [event-spout]] 
[bolts :refer [active-user-bolt follow-bolt feed-bolt]]] 
[backtype.storm [clojure :refer [topology spout-spec bolt-spec]] 
[config :refer :all]]) 


再 次 运行 这 个 拓扑 结构 。 推 送 的 事 





[3 





将 由 拓扑 结构 中 最 后 的 螺栓 在 控制 台 打 印 出 来 : 


$ lein run -m feeds.topoLogy/runl! 
Ry ^ 八 
讨论 


Storm 的 Clojure DSL 看 起 来 不 像 标 准 的 Clojure。 相 反 ， 它 利用 了 Clojure 的 宏 ， 将 语言 扩 
展 到 流 处 理 领 域 。Storm 的 流 处 理 抽象 包含 四 个 核心 原 语 。 





。 元 组 (tuple) 
允许 程序 员 为 值 提供 名 称 。 元 组 是 动态 类 型 的 值 列 表 。 

















344 | 第 9 章 


。 喷嘴 (spout) 
产生 元 组 ， 常 常 通过 读 取 分 布 式 队列 来 实现 。 


。 螺栓 (bolt) 
接受 元 组 作为 输入 并 产生 新 的 元 组 ， 因 为 它们 是 Storm 拓扑 结构 中 的 核心 计算 单元 。 





。 流 (stream) 
用 于 连接 喷嘴 和 螺栓 以 及 螺栓 和 螺栓 ， 创 建 计算 拓扑 结构 。 流 可 以 配置 一 些 规则 ， 决 定 
将 特定 类 型 的 元 组 路 由 到 某 些 螺栓 实例 。 


下 面 的 几 个 小 节 回 顾 了 我 们 系统 的 组 件 ， 以 便 更 好 地 了 解 这 些 原 语 如 何 一 起 工作 : 




















event-Spout 
defspout 看 起 来 很 像 Clojure 的 标准 defn， 只 有 一 个 差别 ，defspout 的 第 二 个 参数 是 一 个 
名 字 列 表 ， 将 分 配给 这 个 喷嘴 产生 的 每 个 元 组 的 元 素 。 这 让 你 能 够 将 元 组 和 向 量 或 映射 表 
互 换 使 用 。defspout 的 第 三 个 参数 是 一 个 参数 列表 ， 将 被 绑 定 到 Storm 的 操作 基础 设施 的 
各 个 组 件 上 。 


在 event-spout 喷嘴 的 例子 中 ， 只 用 到 了 collector: 











(defspout event-spout ["event"] 
[conf context collector] 


在 喷嘴 实例 创建 时 ，defspout 的 主体 将 被 求 值 一 次 ， 这 让 你 有 机 会 创建 内 存 中 的 状态 。 通 
常 这 会 连接 到 一 个 数据 库 或 一 个 分 布 式 队列 ， 但 在 这 个 例子 中 ， 你 创建 了 一 个 事件 列表 ， 
包含 了 这 个 喷嘴 将 产生 的 事件 : 





(Let [events [{:action :commented, :user :travis, :listing :red-shoes} 
{:action :liked, :user :jim, :listing :red-shoes} 
{:action :liked, :user :karen, :listing :green-hat} 
{:action :liked, :user :rob, :listing :green-hat} 
{:action :commented, :user :emma, :listing :green-hat}]] 


这 个 对 spout 的 调用 创建 了 一 个 喷嘴 实例 ， 使 用 了 给 定 的 nextTuple 实现 。 这 个 实例 只 是 


休眠 了 一 秒 钟 ， 然 后 用 emit-spout! 产生 一 个 元 素 的 元 组 ， 包 含 一 个 随机 的 、 来 自前 面 列 
表 中 的 事件 : 








(spout 
(nextTuple [] 
(Thread/sleep 1000) 
(emit-spout! collector [(rand-nth events)]))))) 

















nextTuple 将 在 一 个 紧凑 的 循环 中 被 反复 调用 ， 所 以 如 果 你 创建 了 一 个 喷嘴 来 轮 询 外 部 资 
源 ， 可 能 需要 提供 自己 的 补偿 算法 ， 避 免 对 该 资源 产生 过 重 的 负载 。 
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你 也 可 以 实现 喷嘴 的 ack 方法， 来 实现 “可 靠 的 ”喷嘴 ， 它 将 提供 消息 处 理 的 保证 。 关 
于 可 靠 喷 嘴 的 更 多 信息 ， 参 见 针 对 Kestrel 队列 系统 的 Storm 喷嘴 实现 ，storm-kestrel 
( https://github.com/nathanmarz/storm-kestrel 这 








active-user-bolt 

每 次 用 户 对 系统 执行 一 个 动作 ， 系 统 都 需要 判断 其 他 用 户 是 否 会 对 它 有 兴趣 。 对 于 像 
Twitter 这 样 的 简单 兴趣 系统 ， 用 户 表达 兴趣 只 有 一 种 方式 〈 即 关注 )， 你 可 以 简单 地 查看 
执行 动作 用 户 的 关注 列表 ， 相 应 地 更 新 推送 。 但 在 更 复杂 的 系统 中 ， 兴 趣 可 能 表示 为 喜欢 
过 的 物件 被 执行 了 动作 ， 关 注 的 集合 中 添加 了 物件 ， 或 关注 了 物件 的 卖家 。 在 这 个 世界 
中 ， 你 需要 考虑 不 同 的 因素 ， 针 对 系统 中 的 每 个 用 户 ， 针 对 每 个 事件 ， 决 定 事件 是 否 应 该 
加 入 用 户 的 推送 。 


第 一 个 螺栓 启动 了 这 个 过 程 ， 在 每 次 event-spout 生成 一 个 事件 时 ， 该 螺栓 针对 系统 中 的 
每 个 用 户 ， 生 成 一 个 (user，event) 元 组 : 






































(defbolt active-user-bolt ["user" "event"] [{event "event" :as tuple} collector] 
(doseq [user [:jim :rob :karen :kaitlyn :emma :travis]] 
(emit-bolt! collector [user event])) 
(ack! collector tuple)) 


defbolt 的 签名 看 起 来 很 像 defspout。 第 二 个 参数 是 一 个 名 字 列 表 ， 将 分 配给 这 个 螺栓 产 
生 的 元 组 ， 第 三 个 参数 是 一 个 参量 列表 。 第 一 个 参量 将 绑 定 到 输入 元 组 ， 可 以 像 映射 表 或 
向 量 那样 解构 。 

这 个 螺栓 的 主体 对 系统 中 的 用 户 列表 进行 迭代 ， 对 每 个 用 户 产生 一 个 元 组 。 主 体 的 最 后 一 
行 对 元 组 调用 了 ack!， 这 让 Storm 追踪 消息 处 理 ， 并 在 合适 的 时 候 重 启 处 理 。 














follow-bolt 

下 一 个 螺栓 是 一 个 “准备 好 的 螺栓 ”， 这 就 是 说 ， 它 保持 内 存 状态 。 在 许多 情况 下 ， 这 意 
味 着 连接 到 一 个 数据 库 或 一 个 队列 ， 或 者 一 个 数据 结构 ， 能 聚合 它 处 理 的 元 组 的 某 些 方 
面 ， 但 这 个 例子 将 系统 中 完整 的 关注 者 列表 保持 在 内 存 中 。 


这 个 螺栓 看 起 来 更 像 喷嘴 的 定义 。 第 二 个 参数 是 一 个 名 字 的 列表 ， 第 三 个 参数 是 一 个 螺 
栓 配置 选项 的 映射 表 (重要 的 是 ， 将 :prepare 设置 为 true) ， 第 四 个 参数 是 一 个 操作 参数 
集 ， 和 defspout 中 接收 到 的 一 样 : 






































(defbolt follow-bolt ["user" "event"] {:prepare true} 
[conf context collector] 











螺栓 的 主体 先 定义 了 关注 者 列表 ， 然 后 在 对 bolt 的 调用 中 ， 提 供 了 实际 的 螺栓 定义 : 





(Let [foLLows {:jim #{:rob :emma} 
:rob #{:karen :kaitlyn :jim} 





:karen #{:kaitlyn :emma} 
:kaitlyn #{:jim :rob :karen :kaitlyn :emma :travis} 
:emma #{:karen} 
:travis #{:kaitlyn :emma :karen :rob}}] 
(bolt 
(execute [{user "user" event "event" :as tuple}] 
(when ((follows user) (:user event)) 
(emit-bolt! collector [user event])) 
(ack! coLLector tuple))))) 


请 注意 ， 在 这 里 ， 元 组 参数 是 在 螺栓 的 execute 定义 之 内 ， 可 以 像 平常 一 样 解构 。 如 果 
件 的 用 户 没有 关注 这 个 元 组 中 的 用 户 ， 那 么 它 就 不 会 产生 新 的 元 组 ， 只 是 告知 它 收 到 了 输 
入 消息 oo 


中 











前 面 曾 提 到 ， 这 个 特殊 系统 的 实现 可 以 更 简单 ， 只 需 查 询 某 个 记录 了 关注 关系 的 数据 库 ， 
并 在 每 个 关注 者 的 推送 中 添加 一 个 故事 。 但 是 ， 因 为 预期 会 有 更 复杂 的 系统 ， 所 以 提供 了 
一 个 可 以 大 规模 扩展 的 架构 。 这 个 螺栓 可 以 很 容易 扩展 为 一 组 评分 螺栓 ， 每 个 都 基于 自己 
的 判 据 对 user/event 进行 评估 ， 并 产生 (user ，event，score) 元 组 。 评 分 聚合 螺栓 将 接收 每 
个 评分 螺栓 的 评分 ， 在 收 到 系统 中 各 种 类 型 的 评分 螺栓 的 评分 后 ， 选 择 产 生 一 个 元 组 。 在 
这 个 世界 中 ， 调 整 决 定 用 户 推送 构成 的 因素 以 及 它们 的 相对 权重 就 很 容易 。 实 际 上 ， 以 作 
者 的 观点 来 看 ， 这 种 系统 的 生产 体验 是 令 人 高 兴 的 (参见 GitHub 的 Rising Tide 项 目 页 面 
https://github.com/utahstreetlabs/risingtide ) 。 





| 



































feed-bolLt 
最 后 的 螺栓 聚合 事件 ， 形 成 推送 。 由 于 它 只 接受 “评分 系统 ”批准 的 (user ，event) 元 组 ， 
所 以 只 需要 将 事件 添加 到 原来 为 指定 用 户 接 收 的 事件 列表 。 














(let [feeds (atom {})] 
(bolt 
(execute [{user "user" event "event" :as tuple}] 
(swap! feeds #(update-in % [user] conj event)) 
(println "Current feeds:") 
(clojure.pprint/pprint @feeds) 
(ack! collector tuple)))) 








在 收 到 新 事件 时 ， 这 个 玩具 似 的 拓扑 结构 只 是 将 当前 的 推送 打印 出 来 ， 但 在 真实 世界 中 ， 
可 以 将 推送 持久 到 一 个 数据 存储 库 或 缓冲 中 ， 以 便 高 效 地 将 推送 发 送 给 用 户 。 


请 注意 ， 这 个 设计 很 容易 扩展 到 支持 事件 融合 ， 它 不 是 将 每 个 事件 分 开 存 储 ， 而 是 可 以 聚 
合 进入 的 事件 和 其 他 类 似 事件 ， 为 用 户 提供 方便 。 


正如 前 面 描述 的 ， 这 个 系统 有 一 个 大 缺陷 ， 默认 情况 下 ，Storm 元 组 被 传送 到 每 种 螺 检 的 
一 个 实例 ， 而 螺栓 的 实例 数 不 是 在 螺栓 实现 中 定义 的 。 如 果 这 个 拓扑 结构 的 操作 者 添加 了 
多 个 feed-bott， 可 能 会 让 同一 个 用 户 的 事件 传送 到 不 同 的 螺栓 实例 ， 给 每 个 螺栓 提供 同 
一 个 用 户 的 不 同 推送 。 
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让 人 高 兴 的 是 ， 这 个 缺陷 因 Storm 支持 流 分 组 (stream grouping) 而 得 到 解决 。 流 分 组 在 
Storm 拓扑 结构 定义 中 指定 。 














拓扑 结构 
拓扑 结构 定义 是 最 具 挑 战 性 的 地 方 。 喷 嘴 连 接 到 螺栓 ， 螺 栓 连 接 到 其 他 螺栓 ， 可 以 对 它们 
之 间 的 元 组 流 进行 配置 ， 提 供 对 计算 有 意义 的 属性 。 


这 也 是 定义 拓扑 结构 中 组 件 级 并 行 的 地 方 ， 它 为 系统 真正 的 操作 并 行 提 供 了 一 张 粗 略 的 


草图 。 
拓扑 结构 定义 包括 喷嘴 规格 说 明和 螺栓 规格 说 明 ， 它 们 都 是 一 个 名 字 到 规格 说 明 的 映射 表 。 


喷嘴 规格 说 明 只 是 为 喷嘴 实现 提供 了 一 个 名 字 : 





























{"events" (spout-spec event-spout)} 








可 以 配置 多 个 喷嘴 ， 规 格 说 明 可 以 定义 喷嘴 的 并 行 : 
{ 


"events" (spout-spec event-spout) 
"parallel-spout" (spout-spec a-different-more-parallel-spout :p 2) 


} 





这 个 定义 意味 着 该 拓扑 结构 具有 一 个 event-spout 实例 和 两 个 a-different-more-parallel- 
spout 实例 。 





螺栓 定义 有 一 点 复杂 : 


"active users" (bolt-spec {"events" :shuffle} active-user-bolt :p 2) 
"follows" (bolt-spec {"active users" :shuffle} follow-bolt :p 2) 


像 喷嘴 规格 说 明 一 样 ， 必 须 为 螺栓 提供 一 个 名 字 ， 并 指定 它 的 并 行 。 此 外 ， 螺 栓 需要 指定 
流 分 组 ， 它 定义 了 : (a) 该 螺栓 从 哪个 组 件 接收 元 组 ，(b) 系统 如 何 选择 内 存 中 哪个 螺栓 
实例 ， 向 它 发 送 元 组 。 这 两 个 例子 中 都 指定 了 :shuffle， 它 的 意思 是 来 自 “events” 的 元 
组 将 被 随机 地 送 到 一 个 active-user-bolt 实例 ， 来 自 “active users” 的 元 组 将 被 随机 地 送 
到 一 个 follow-bolt 实例 。 























前 面 曾 提 到 ，feed-bolt 需要 更 谨慎 : 

"feeds" (bolt-spec {"follows" ["user"]} feed-bolt :p 2) 
这 个 螺栓 规格 说 明 指 定 针 对 “user” 进 行 字 段 分 组 (fields grouping)。 这 意味 着 具有 相同 
“user” 值 的 所 有 元 组 都 会 发 送 到 同一 个 feed-bolt 实例 。 这 个 流 分 组 配置 了 一 个 字段 名 
称 列表 ， 所 以 字段 分 组 考虑 多 个 字段 值 的 相等 性 ， 然 后 决定 哪个 螺栓 实例 来 处 理 给 定 的 
元 组 。 




















Storm 的 流 分 组 也 支持 将 元 组 发 送 到 所 有 实例 和 分 组 ， 或 者 让 螺栓 产生 一 个 元 组 来 决定 将 
它 发 送 到 哪里 。 结 合 已 经 看 到 的 分 组 方式 ， 它 们 提供 了 极 大 的 灵活 性 ， 来 决定 数据 如 何 流 
过 你 的 拓扑 结构 。 

每 个 组 件 规格 说 明 都 支持 并 行 选项 。 因 为 拓扑 结构 没有 指定 它 运行 的 物理 硬件 ， 这 些 瞳 
示 不 能 用 于 确定 系统 真正 的 并 行 ， 但 集群 可 以 利用 它们 来 确定 创建 多 少 指定 组 件 的 内 存 
实例 。 














部 署 

Storm 真正 的 魔力 来 自 于 部 署 。Storm 提供 了 工具 ， 让 你 构建 小 的 、 独 立 的 组 件 ， 且 并 未 假 
定 在 同一 个 拓扑 结构 中 有 多 少 个 同样 的 实例 在 运行 。 这 意味 着 该 拓扑 结构 本 身 的 伸缩 性 实 
际 上 是 无 限 的 。 系 统 边 界 与 队列 或 数据 库 这 样 的 外 部 组 件 之 间 实 现 数据 收发 ， 它 们 不 需要 
可 伸缩 ， 但 在 许多 情况 下 ， 大 家 都 很 清楚 如 何 让 这 些 服务 可 伸缩 。 


Storm 库 内 建 一 个 简单 的 部 署 策略 ; 























(doto (LocalCluster.) 
(.submitTopology "my first topology" 
{TOPOLOGY-DEBUG (Boolean/parseBoolean debug) 
TOPOLOGY -WORKERS (Integer/parseInt workers)} 
(storm-topology))) 





LocalCluster 是 Storm 集群 的 内 存 实现 。 你 可 以 指定 工作 者 (worker) 的 数目 ， 它 利用 
这 些 工作 者 来 执行 拓扑 结构 的 组 件 ， 并 提交 该 拓扑 结构 本 身 ， 从 此 它 开 始 轮 询 该 拓扑 结 
构 的 喷嘴 的 nextTuple 方法 。 随 着 喷嘴 产生 元 组 ， 它 们 被 传送 通过 系统 ， 完 成 该 拓扑 结 
构 的 计算 。 


向 一 个 配置 好 的 集群 提交 拓扑 结构 差不多 同样 简单 ， 就 像 你 在 src/feeds/TopologySubmitter. 
clj 中 看 到 的 : 











but 





(defn -main [& {debug "debug" workers "workers" :or {debug "false" workers "4"}}] 
(StormSubmitter/submitTopology 
"feeds topology" 
{TOPOLOGY-DEBUG (Boolean/parseBoolean debug) 
TOPOLOGY-WORKERS (Integer/parseInt workers)} 
(storm-topology))) 





这 个 文件 利用 了 Clojure 的 Java 互 操作 性 来 产生 一 个 有 main 方法 的 Java 类 。 因 为 project. 
cj 文件 指定 这 个 文件 应 该 事先 编译 ， 所 以 在 用 lein uberjar 来 生成 适合 提交 给 集群 的 
JAR 时 ， 这 个 文件 会 被 编译 ， 看 起 来 就 像 普通 的 Java 类 文件 。 你 可 以 将 这 个 JAR 上 传 到 
运行 Storm 的 Nimbus 守护 进程 的 机 器 ， 用 storn 命令 来 提交 执行 : 








$ storm jar path/to/thejariuploaded.jar feeds.TopoLogySubmitter "workers" 5 








这 个 命令 告诉 集群 分 配 5 个 专门 的 工作 者 给 这 个 拓扑 结构 ， 开 始 对 它 的 所 有 喷嘴 轮 询 
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nextTupte， 就 像 你 在 使 用 Locatctluster 时 它 做 的 一 样 。 集 群 可 以 同时 运行 任意 数目 的 拓 
扑 结构 ， 因 为 每 个 工作 者 是 一 个 物理 JVM， 最 终 可 能 运行 许多 不 同 螺 栓 和 喷嘴 的 实例 。 


设置 和 运行 Storm 集群 的 全 部 细节 超出 了 本 实例 的 范围 ， 但 它们 在 Storm 的 维基 页 面 上 有 
量 的 文档 。 


结论 

我 们 只 接触 到 Storm 提供 的 一 部 分 功能 。 它 内 建 的 分 布 式 远程 过 程 调 用 ， 人 允许 用 户 利用 
Storm 集群 的 力量 发 出 同步 请 求 ， 触 发 几 百 台 或 几 千 台 机 器 的 一 阵 活动 。 它 保证 数据 得 到 
处 理 的 语义 ， 允 许 用 户 构 建 极为 健壮 的 系统 。 三 叉 戟 (Trident) 这 个 基于 Storm 原 语 的 高 
层 抽象 ， 为 复杂 的 实时 计算 问题 提供 了 简单 得 惊人 的 解决 方案 。 它 有 详细 的 运行 时 控制 
台 ， 针 对 完全 可 运营 的 Storm 集群 ， 为 运行 时 特征 提供 了 关键 的 信息 。 这 个 系统 提供 的 能 
力 确实 不 同 寻 常 。 















































Storm 也 是 一 个 极 好 的 例子 ， 展 示 了 Clojure 扩展 到 问题 域 的 能 力 。 它 的 构造 扩展 了 Clojure 
的 语法 ， 并 且 符 合 语言 习惯 ， 让 程序 员 停留 在 实时 处 理 的 领域 内 ， 不 需要 面 对 低 层 语言 的 
繁 文 丝 节 。 这 使 得 Storm 真正 退 到 幕后 。 在 书写 良好 的 Storm 拓扑 结构 的 代码 集中 ， 大 多 
数 代码 专 广 于 手头 的 问题 。 结 果 是 简洁 的 、 可 维护 的 代码 以 及 快乐 的 程序 员 。 














参阅 

。 Storm 的 网 站 (http://storm-project.net/)。 

。 Storm 项 目 模板 (https://github.com/travis/lein-storm-project-template ) 。 

。 storm-deploy (https://github.com/nathanmarz/storm-deploy) ,一 个 Storm 简单 部 署 的 工具 。 
。 Rising Tide (https://github.com/utahstreetlabs/risingtide) ， 本 实例 基于 的 推送 生成 服务 。 


9.2 用 抽取 转换 加 载 (ETL) 管道 来 处 理 数据 


作者 : Alex Robbins 





问题 
需要 将 大 量 数据 的 格式 从 JSON 列表 改 为 CSV， 以 便 进一步 处 理 。 例 如 ， 需 要 将 这 样 的 
输入 : 




















{"name": "Clojure Programming", "authors": ["Chas Emerick", 
"Brian Carper", 
"Christophe Grand"]} 
{"name": "The Joy of Clojure", "authors": ["Michael Fogus", "Chris Houser"]} 





转 成 这 样 的 输出 : 








350 | 第 9 章 


Chas Emerick,Brian Carper,Christophe Grand 
Michael Fogus,Chris Houser 


解决 方案 
Cascalog 允许 你 编写 分 布 式 处 理 任务 ， 小 的 任务 可 以 在 本 地 运行 ， 大 的 任务 可 以 在 Hadoop 
集群 上 运行 。 


要 继续 本 实例 ， 先 创建 一 个 新 的 Leiningen 项 目 : 





$ lein new cookbook 


修改 新 项 目的 project.clj 文件 ， 添 加 cascalog 的 依赖 关系 ， 设 置 :dev 特性 描述 ， 对 
cookbook.etl 命名 空间 启用 AOT 编译 。 你 的 project.clj 文件 现在 看 起 来 应 该 像 这 样 : 


(defproject cookbook "0.1.0-SNAPSHOT" 
:description "FIXME: write description" 
:url "http://example.com/FIXME" 
:license {:name "Eclipse Public License" 
:url "http://www.eclipse.org/legal/epl-v10.html"} 

:dependencies [[org.clojure/clojure "1.5.1"] 

[cascalog "1.10.2"] 

[org.clojure/data.json "0.2.2"]] 
:profiles {:dev {:dependencies [[org.apache.hadoop/hadoop-core "1.1.2"]]}} 
:aot [cookbook.etL]) 





创建 src/cookbook/etl.clj 文件 ， 并 向 它 添 加 查询 : 


(ns cookbook.etl 
(:require [cascalog.api :refer :alll] 
[clojure.data.json :as json])) 


(defn get-vec 
"Wrap the result in a Vector for Cascalog to consume." 
[m k] 
(vector 
(get m k))) 


(defn vec->csv 
"Turn a vector into a CSV string. (Not production quality)." 


[v] 
(apply str (interpose "," v))) 


(defmain Main [in out & args] 


(?<- 
(hfs-textline out :sinkmode :replace) 
[?out-csv] 


((hfs-textline in) ?in-json) 
(json/read-str ?in-json :> ?book-map) 
(get-vec ?book-map "authors" :> ?authors) 
(vec->csv ?authors :> ?out-csv))) 
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创建 输入 数据 文件 samples/books/books.json: 


"name": "Clojure Cookbook", "authors": ["Ryan", "Luke"]} 


这 个 解决 方案 的 全 部 内 容 都 在 GitHub 的 Cascalog samples 代码 库 (https:// 





github.com/clojure-cookbook/cascalog-samples) 中 。 
要 获取 这 个 工作 项 目的 副本 ， 就 从 GitHub 复制 该 项 目 ， 并 签 出 etl-sample 
分 支 。 











$ git clone https://github.com/clojure-cookbook/cascalog-samples.git 
$ cd cascalog-samples 
$ git checkout etl-sample 


现在 可 以 用 Lein run 在 本 地 执行 任务 ， 提 供 输 入 和 输出 文件 : 





$ lein run -m cookbook.etl.Main samples/books/books.json samples/books/output 
# Or, on a Hadoop cluster 
$ lein uberjar 


$ hadoop jar target/cookbook-standalone.jar cookbook.etl.Main \ 
books.json books.csv 


samples/books/output/part-00000 中 的 结果 是 : 


Ryan,Luke 


讨论 
虽然 写 一 个 脚本 将 TSON 转换 成 CSV 很 容易 ， 但 要 让 这 个 脚本 在 许多 机 器 上 运行 ， 就 需 
要 大 量 工作 。 用 Cascalog 来 编写 转换 脚本 ,运行 在 本 地 模式 或 分 布 式 模式 时 几乎 不 需要 
修改 。 


前 面 的 小 例子 中 有 许多 新 概念 和 语法 ， 让 我 们 一 条 一 条 地 分 析 一 下 。 


在 这 个 实例 中 ， 数 据 基本 上 按 顺序 流 过 函数 。 第 一 行 用 defmain 宏 (来 自 Cascalog) 定义 了 
一 个 带 有 -main 函数 的 类 ， 让 你 在 Hadoop 上 执行 查询 。 在 这 个 例子 中 ， 带 有 -main 函数 的 类 
名 为 Main， 但 这 不 是 必须 的 。defmaiin 允许 你 在 同一 个 文件 中 创建 多 个 支持 Hadoop 的 查询 : 

















(defmain Main [in out & args] 
在 Main 函数 中 是 一 个 Cascalog 操作 符 ，?<- ，， 它 定义 并 执行 一 个 查询 : 


(?<- 





注 1: 虽然 查询 看 起 来 “ 像 ”普通 的 Clojure， 但 它们 实际 上 是 DSL。 如 果 你 不 熟悉 Cascalog 查询 ， 可 以 
从 Nathan Marz 的 文章 Introducing Cascalog (http://nathanmarz.com/blog/introducing-cascalog-a-clojure- 
based-query-language-for-hado.html) 中 了 解 更 多 的 信息 。 
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个 操作 接受 一 个 输出 位 置 [在 Cascalog 中 称 为 “龙头 ”(tap) ]， 一 个 结果 向 量 ， 以 及 一 
ge 下 一 行 是 目的 地 ， 输 出 将 写 入 的 位 置 。 同样 的 函数 被 用 于 创建 输入 和 输出 
龙头 : 





(hfs-textline out :sinkmode :replace) 





这 个 例子 用 了 hfs-textline， 但 还 有 许多 其 他 龙头 。 你 其 至 可 以 自己 写 。 





在 你 的 输出 龙头 中 使 用 :sinkmode :replace，Cascalog 将 覆盖 所 有 原 有 的 输 
出 。 如 果 你 要 重新 运行 一 个 查询 并 对 它 进 行 调试 ， 这 是 有 帮助 的 。 否 则 ， 你 
不 得 不 在 每 次 重新 运行 时 ， 删 除 输出 文件 。 

















这 是 一 个 列表 ， 包 含 该 查询 应 该 返回 的 所 有 逻辑 变量 : 
[?out-csv] 


在 这 个 例子 中 ， 这 些 是 将 要 存放 到 输出 位 置 的 逻辑 变量 。Cascalog 知道 它们 是 特殊 的 逻辑 
变量 ， 因 为 它们 的 名 字 以 ?或 ! 开头。 








在 理解 逻辑 变量 时 ， 可 以 将 它们 看 成 是 包含 所 有 可 能 有 效 的 值 。 如 果 你 添加 
谓词 ， 要 么 引入 了 新 的 逻辑 变量 ， 它 们 (预期 会 ) 链接 到 原 有 的 逻辑 变量 ， 
要 么 对 原 有 的 逻辑 变量 添加 了 约束 。 




















下 一 行 定义 了 输入 龙头 。JSON 数据 结构 将 从 in 指定 的 位 置 ， 每 次 读 和 一行。 每 一 行 都 会 
存储 在 ?in-json 逻辑 变量 中 ， 它 将 流 过 余下 的 逻辑 谓词 : 





((hfs-textline in) ?in-json) 
read-str 将 ?in-json 中 的 JSON 字符 串 解析 为 一 个 散 列 映射 表 ， 保 存在 ?book-map 中 : 


(json/read-str ?in-json ?book-map) 








现在 你 将 authors 从 映射 表 中 取出 ， 并 将 该 向 量 保存 到 它 自己 的 逻辑 变量 中 。Cascalog 假定 
a si a 量 。 要 绕 过 Cascalog 的 假定 ， 就 把 输出 包装 在 一 个 额外 的 
向 量 中 ， 供 Cascalog 使 用 : 











(get-vec ?book-map "authors" ?authors) 


最 后 ， 利 用 vec->csv 函数 ， 将 作者 向 量 转 换 成 合法 的 CSV。 这 一 行将 为 逻辑 变量 ?out- 
csv 产生 值 ， 它 的 名 字 曾 出 现在 前 面 的 输出 行 中 ， 因 此 该 查询 将 产生 输出 : 





(vec->csv ?authors ?out-csv))) 
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对 于 构建 抽取 转换 加 载 (ETL) 管道 ，Cascalog 是 一 个 很 好 的 工具 。 它 让 你 有 更 多 的 时 间 
来 思考 数据 ， 花 更 少 的 时 间 来 考虑 读 取 文 件 、 分 布 式 工作 和 管理 依赖 关系 。 在 编写 你 自己 
的 ETL 管道 时 ， 遵 循 下 面 的 步 又 或 许 有 帮助 。 


(1) 确定 输入 格式 。 
(2) 确定 输出 格式 。 
(3) 从 输入 格式 开始 工作 ， 追 踪 每 一 步 当 前 的 格式 .。 

















参阅 

。 Ian Rumford 的 博客 文章 “Using Cascalog for Extract Transform and Load” (http://ianrum 
ford.github.io/blog/2012/09/29/using-cascalog-for-extract-transform-and-load/) 。 

。 core.logic (https://github.com/clojure/core.logic)，Clojure 的 逻辑 编程 库 。 


9.3 ”聚合 大 型 文件 


作者 : Alex Robbins 











问题 
需要 从 一 些 儿 个 TT 的 日 志文 件 中 ， 产 生 聚 合 的 统计 结果 。 例 如 ， 对 于 简单 的 输入 日 志文 件 
(<date>,<URL>,<USER-ID>) : 




















20130512020202,/,11 
20130512020412 , / ,23 
20130512030143 , /post/clojure,11 
20130512040256, /post/datomic ,23 
20130512050910, /post/clojure,11 
20130512051012, /post/clojure,14 


希望 输出 这 样 的 聚合 统计 结果 : 








"URL” {"/" 2 
"/post/datomic" 1 
"/post/clojure" 3} 

"User" {"23" 2 
"11" 3 
"14" 1} 

"Day" {"20130512" 6} 

} 





解决 方案 
Cascalog 允许 你 编写 分 布 式 处 理 任务 ， 运 行 在 本 地 或 Hadoop 集群 上 。 
要 继续 这 个 实例 ， 请 复制 Cascalog samples GitHub 代码 库 (https://github.com/clojure-cookbook/ 


cascalog-samples)， 并 签 出 aggregation-begin 分支 。 这 将 提供 一 个 基本 的 Cascalog 项 目 ， 
就 像 9.2 节 “ 用 抽取 转换 加 载 (ETL) 管道 来 处 理 数据 ”中 创建 的 一 样 : 









































$ git clone https://github.com/clojure-cookbook/cascalog-samples.git 
$ cd cascalog-samples 
$ git checkout aggregation-begin 


现在 将 [cascalog/cascalog-more-taps "2.0.0"] 添加 到 项 目 依 赖 关系 中 ， 将 cookbook. 
aggregation 设置 为 AOT 编译 。project.clj 应 该 看 起 来 像 这 样 : 





(defproject cookbook "0.1.0-SNAPSHOT" 

:description "FIXME: write description" 

:url "http://example.com/FIXME" 

:license {:name "Eclipse Public License" 

:url "http://www.eclipse.org/legal/epl-v10.html"} 

:dependencies [[org.clojure/clojure "1.5.1"] 
[cascalog "2.0.0"] 
[cascalog/cascalog-more-taps "2.0.0"] 
[org.clojure/data.json "0.2.2"]] 

:profiles {:dev {:dependencies [[org.apache.hadoop/hadoop-core "1.1.2"]]}} 

:aot [cookbook.etl 

cookbook.aggregation]) 





创建 文件 src/cookbook/aggregation.clj， 在 其 中 添加 聚合 查询 : 


(ns cookbook.aggregation 
(:require [cascalog.api :refer :alll] 
[cascalog.more-taps :refer [hfs-delimited]])) 


(defn init-aggregate-stats [date url user] 
(let [day (.substring date 0 8)] 
{"URL" {url 1} 
"User" {user 1} 
"Day" {date 1}})) 


(def combine-aggregate-stats 
(partial merge-with (partial merge-with +))) 


(defparallelagg aggregate-stats 
:init-var #'init-aggregate-stats 
:combine-var #'combine-aggregate-stats) 


(defmain Main [in out & args] 
(?<- 
(hfs-textline out :sinkmode :replace) 
[?out] 
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((hfs-delimited in :delimiter ",") ?date ?url ?user) 
(aggregate-stats ?date ?url ?user :> ?out))) 


在 samples/posts/posts.csv 文件 中 添加 一 些 样本 数据 : 


20130512020202,/,11 
20130512020412, / ,23 
20130512030143, /post/clojure,11 
20130512040256, /post/datomic ,23 
20130512050910, /post/clojure,11 
20130512051012, /post/clojure,14 


这 个 解决 方案 的 全 部 内 容 都 可 以 在 Cascalog samples 代码 库 (https://github. 
com/clojure-cookbook/cascalog-samples) 的 aggregation-comptLete 分 支 中 
找到 。 





要 获取 这 个 工作 项 目的 拷贝 和 样本 数据 ， 请 签 出 该 分 支 。 


$ git checkout aggregation-CompLete 
现在 你 可 以 在 本 地 执行 该 任务 : 


$ lein run -m cookbook.aggregation.Main \ 
samples/posts/posts.csv samples/posts/output 


# Or, on a Hadoop cluster 

$ lein uberjar 

$ hadoop jar target/cookbook-standalone.jar \ 
cookbook.aggregation.Main \ 
samples/posts/posts.csv samples/posts/output 

















samples/posts/output/part-00000 中 的 结果 根据 可 读 性 进行 了 格式 化 ， 像 这 样 : 


{ 

"URL" {"/" 2 
"/post/datomic" 1 
"/post/clojure" 3} 

"User" {"23" 2 


113 
"14" 1} 
"Day" {"20130512" 6} 
} 
讨论 


Cascalog 使 得 快速 产生 聚合 统计 数字 变 得 很 容易 。 对 于 某 些 映射 归 约 (MapReduce) 框架 ， 
聚合 统计 数字 可 能 有 点 麻烦 。 一 般 来 说 ， 映 射 归 约 任 务 的 映射 阶段 会 在 集群 上 很 好 地 分 
布 ， 但 归 约 阶段 常常 分 布 得 不 那么 好 。 例 如 ， 无 经 验 的 人 来 设计 聚合 算法 ， 会 让 所 有 聚合 
工作 在 一 台 归 约 机 器 上 执行 。 如 果 所 有 聚合 在 一 个 节点 上 完成 ， 那 么 在 归 约 阶段 ，2000 台 














大 
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计算 机 集群 就 会 像 1 台 计 算 机 一 样 慢 。 
在 开始 编写 自己 的 聚合 算法 之 前 ， 请 先 查 看 cascatog. Logic.ops 的 源 代码 。 这 个 命名 空间 
有 许多 有 用 的 函数 ， 可 能 已 经 完成 了 你 想 做 的 事 。 


在 我 们 的 例子 中 ， 目 标 是 计算 每 个 URL 出 现 的 次 数 。 要 创建 最 终 的 映射 表 ， 所 有 的 URL 
需要 最 终 集中 到 一 个 归 约 器 上 。 没 有 经 验 的 程序 实现 会 对 所 有 元 组 使 用 一 个 聚合 算法 。 这 
意味 着 只 在 一 个 节点 上 完成 所 有 的 工作 ， 计 算 所 花 的 时 间 就 像 在 一 台 计 算 机 上 一 样 。 











解决 方案 是 利用 Hadoop 的 结合 器 (combiner) 函数 。 结 合 器 函数 在 输出 发 送 到 归 约 器 之 
前 ， 针 对 映射 阶段 的 结果 执行 。 最 重要 的 是 ， 结 合 器 运行 在 映射 器 的 节点 上 。 这 意味 着 
结合 器 的 工作 分 布 在 整个 集群 上 ， 就 像 映射 的 工作 一 样 。 如 果 大 多 数 工 作 都 在 映射 和 结 
合 器 的 阶段 完成 ， 归 约 的 阶段 就 会 立刻 完成 。Cascalog 让 它 变 得 非常 容易 。 许 多 内 建 的 
Cascalog 函数 都 在 背后 用 到 了 结合 器 ， 所 以 你 甚至 不 用 试 ， 就 能 写 出 高 度 优化 的 查询 。 你 
甚至 可 以 用 defparallelagg 宏 ， 编写 自 己 的 函数 来 利用 结合 器 。 














Cascalog 常常 处 理 var， 而 不 是 那些 var 的 值 。 例 如 ， 调 用 defparallelagg 
时 接受 引用 的 参数 。#' 语法 意味 着 var 被 传递 ， 而 不 是 var 引用 的 值 。 
Cascalog 传递 这 些 var 而 不 是 值 ， 这 样 它 就 不 必 将 函数 序列 化 ， 再 将 这 些 函 
数 传递 给 映射 器 或 归 约 器 。 它 只 要 传递 var 的 名 称 ， 该 名 称 将 在 远程 执行 环 
境 中 查找 。 这 意味 着 你 不 能 为 Cascalog 工作 流 的 某 些 部 分 动态 地 构建 国 数 。 
大 多 数 国 数 需要 绑 定 到 var。 














defparallelagg 开始 有 点 令 人 迷惑 ， 但 它 有 通过 编写 查询 ， 利 用 结合 器 的 能 力 ， 因 此 值 
得 学 习 。 你 需要 提供 两 个 var， 指 向 defparallelagg 调用 的 函数 : init-var 和 combine- 
var。 请 广 意 ， 这 两 个 参数 都 是 作为 var 传递 ， 而 不 是 函数 值 ， 因 此 需要 在 名 称 前 面 加 上 
#' 。init-var 函数 需要 接收 输入 数据 ， 改 变 它 的 格式 ， 以 便 容易 被 combine-var 函数 处 
理 。 在 这 个 例子 中 ， 解 决 方案 将 数据 变 成 包含 一 些 映 射 表 的 映射 表 ， 能 够 很 容易 合并 。 合 
并 映射 表 是 编写 并 行 聚合 器 的 一 种 简单 方法 。combine-var 函数 必须 是 可 传递 的 、 可 关联 
的 。 该 函数 被 调用 接收 init-var 函数 的 两 个 输出 实例 。 返 回 值 将 作为 参数 ， 传 递 给 稍 后 的 
combine-var 函数 调用 。 输 出 对 将 被 合并 ， 直 到 只 剩 下 一 个 输出 ， 这 就 是 最 终 输 出 。 


下 面 详细 解释 一 下 查询 。 
首先 ， 请 求 你 需要 的 Cascalog 国 数 : 











(ns cookbook.aggregation 
(:require [cascalog.api :refer :alLL] 
[cascalog.more-taps :refer [hfs-delimited]])) 


然后 定义 一 个 函数 init-aggregate-stats， 它 接受 一 个 日 期 、URL 和 用 户 ， 返 回 一 个 包含 
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映射 表 的 映射 表 。 第 二 级 别 的 映射 含有 与 被 观察 的 值 所 对 应 的 键 。 这 是 init 函数 ， 它 接受 
每 一 行 记录 ， 准 备 好 进行 聚合 : 








(defn init-aggregate-stats [date url user] 
(let [day (.substring date 0 8)] 
{"URL" {url 1} 
"User" {user 1} 
"Day" {date 1}})) 
combine-aggregate-stats 图 数 接受 init-aggregate-stats 函数 对 于 所 有 输入 数据 的 输出 ， 
并 结合 在 一 起 。 这 个 函数 会 反复 调用 ， 结 合 init-aggregate-stats 函数 的 输出 和 它 自 己 的 
输出 。 它 的 输出 应 该 和 输入 格式 一 样 ， 因 为 这 个 函数 将 对 两 个 输出 进行 调用 ， 直 到 只 剩 下 
一 个 输出 数据 。 这 个 函数 合并 嵌 套 的 映射 表 ， 将 相同 的 键 对 应 的 值 加 起 来 。 
(def combine-aggregate-stats 
(partial merge-with (partial merge-with +))) 





























aggregate-stats 接受 前 面 两 个 国 数 ， 将 它们 转化 成 Cascalog 的 并 行 聚合 操作 。 请 注意 ， 
你 传递 的 是 var， 而 不 是 函数 本 身 : 
(defparallelagg aggregate-stats 


:init-var #'init-aggregate-stats 
:combine-var #'combine-aggregate-stats) 





最 后 ， 建 立 Main 来 定义 并 执行 查询 ， 该 查询 对 in 中 所 有 输入 调用 aggregate-stats 操作 ， 
结果 写 入 out: 


(defmain Main [in out & args] 

;; 这 定义 并 执行 一 次 Cascalog 查询 

(?<- 
;; 设置 输出 路 径 
(hfs-textline out :sinkmode :replace) 
;; 定义 哪些 逻辑 变量 将 输出 
[?out] 
;; 设置 输入 路 径 ， 定 义 绑 定 到 输入 的 逻辑 变量 
((hfs-delimited in) ?date ?url ?user) 
;; 执行 聚合 操作 
(aggregate-stats ?date ?url ?user :> ?out))) 








如 果 你 想 计算 的 聚合 不 能 用 defparatlelagg 来 定义 ，Cascalog 还 提供 了 其 他 一 些 方法 来 定 
义 聚 合 。 但 是 ， 其 中 许多 没有 使 用 结合 器 ， 可 能 导致 大 多 数 计算 发 生 在 少数 归 约 器 上 。 计 
算 也 许 能 完成 ， 但 来 失 了 分 布 式 计算 的 许多 好 处 。 请 查看 cascalog.1logic.ops 的 源 代码 ， 
看 看 有 哪些 不 同 的 方法 ， 以 及 如 何 使 用 它们 。 





参阅 
。 cascalog.logic.ops 的 源 代码 (https://github.com/nathanmarz/cascalog/blob/develop/cascalog- 
core/src/clj/cascalog/logic/ops.clj) ， 该 命名 空间 包含 了 许多 预定 义 的 操作 (包括 聚合 器 ) 。 
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9.4 测试 Cascalog 工 作 流 


作者 : Alex Robbins 


问题 
你 喜欢 测试 你 的 代码 ， 喜 欢 编 写 Cascalog 任务 ， 但 讨厌 试 着 去 测试 你 的 Cascalog 任务 。 


解决 方案 
Midje-Cascalog (https://github.com/nathanmarz/cascalog/tree/develop/midje-cascalog) 提供 了 

少量 的 附加 功能 ， 让 编写 Cascalog 任务 的 测试 变 得 相当 容易 。 要 继续 这 个 实例 ， 请 复制 
Cascalog samples GitHub 代码 库 (https://github.com/clojure-cookbook/cascalog-samples) 六 
签 出 testing-begin 分支。 这 将 提供 一 个 基本 的 Cascalog 项 目 ， 就 像 9.2 节 “ 用 抽取 转换 
加 载 (ETL) 管道 来 处 理 数 据 ” 中 创建 的 一 样 : 








让 




















出 





接 下 来 将 Midje 插件 和 Midje-Cascalog 依赖 关系 添加 到 project.clj 文件 的 :dev 特性 描 
述 。:profiles 键 看 起 来 应 该 像 这 样 : 














(def project cookbook "0.1.0-SNAPSHOT" 
,DFOf LLES {:dev {:dependencies [[org.apache.hadoop/hadoop-core "1.1.2"] 
[cascalog/midje-cascalog "2.0.0"]] 
:plugins [[lein-midje "3.1.1"]]}}) 








在 src/cookbook/test_me.clj 中 创建 一 个 简单 的 查询 ， 针 对 它 编写 测试 : 


(ns cookbook.test-me 
(:require [cascalog.api :refer :all])) 


(defn capitalize [s] 
(.toUpperCase s)) 


(defn capitalize-authors-query [author-path] 
(<- [?capitalized-author] 
((hfs-textline author-path) ?author) 
(capitalize ?author :> ?capitalized-author))) 


现在 ， 你 可 以 在 test/cookbook/test_me_test.clj 中 ， 为 这 个 查询 写 一 个 测试 : 





(ns cookbook.test-me-test 
(:require [cookbook.midje-cascalog :refer :alll] 
[midje 
[sweet :refer :alll] 
[cascalog :refer :all]])) 


(fact "Query should return capitalized versions of the input names." 
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(capitalize-authors-query :author-path) => (produces [["LUKE VANDERHART"] 
["RYAN NEUFELD"]]) 
(provided 
(hfs-textline :author-path) => [["Luke Vanderhart"] 
["Ryan Neufeld"]])) 


这 个 解决 方案 的 全 部 内 容 都 在 Cascalog samples 代码 库 (https://github.com/ 
clojure-cookbook/cascalog-samples) 的 testing-complete 分 支 中 。 
要 获取 这 个 工作 项 目的 副本 和 样本 数据 ， 请 签 出 该 分 支 。 

$ git checkout testing-complete 








最 后 ， 用 Lein midje 运行 测试 : 


$ lein midje 

2013-11-09 12:19:27.844 java[3620:1703] Unable to load realm info from 
SCDynamicSstore 

ALL checks (1) succeeded. 


讨论 
单元 测试 是 重要 的 “软件 手艺 ”。 但 是 ， 不 夸张 地 说 ， 单 元 测试 Hadoop 工作 流 是 困难 的 。 
大 多 数 分 布 式 计算 开发 都 是 通过 试 错 来 完成 的 ， 只 经 过 有 限 的 手工 测试 ， 然 后 就 认为 工作 
流 “ 足 够 好 ”了 ， 投 入 生产 环境 使 用 。 你 不 应 该 让 代码 的 质量 背 坡 ， 但 测试 分 布 式 代码 可 
能 比较 难 。Midje-Cascalog 让 测试 Cascalog 工作 流 的 不 同 部 分 变 得 容易 ， 因 为 它 使 得 模仿 
子 查询 的 结果 变 得 极其 简单 。 


在 前 面 概述 的 解决 方案 中 ， 你 打算 测试 一 个 简单 的 查询 。 它 从 输入 路 径 中 读 取 一 些 行 ， 将 
它们 转 为 大 写 ， 然 后 输出 。 通 常 ， 你 需要 确保 部 分 测试 将 一 些 测试 数据 写 入 文件 ， 在 测 
试 中 引用 该 文件 ， 然 后 清理 并 删除 该 文件 。 但 如 果 使 用 Midje-Cascalog， 你 将 模拟 hfs- 
textline 调用 。 


























fact 是 Midje 库 提供 的 ， 它 本 身 也 很 值得 学 习 。 它 是 clojure.test 的 deftest 的 替代 
方案 。 在 这 里 ， 你 将 测试 声明 为 一 个 调用 ， 跟 着 是 一 个 箭头 ， 然 后 是 produces 函数 。 
produces 让 你 将 查询 的 结果 写成 一 个 包含 向 量 的 向 量 。 建 立 好 测试 后 ， 你 用 provided 来 描 
述 你 想 模 拟 的 函数 。 这 让 你 只 测试 待 测 函 数 ， 而 不 是 它 依赖 的 那些 函数 。 测 试 Cascalog 工 
作 流 和 测试 应 用 的 其 他 部 分 一 样 重要 。 有 了 Midje-Cascalog， 这 确实 可 以 做 到 。 











参阅 
。 10.2 市 “用 Midje 测试 ”。 
。 GitHub 上 的 Midje-Cascalog 文 档 (https://github.com/nathanmarz/cascalog/tree/develop/ 





midje-cascalog ) 。 
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9.5 设置 Cascalog 任 务 的 检查 点 


作者 : Alex Robbins 


问题 
长 期 运行 的 Cascalog 任务 抛 出 了 错误 ， 然 后 需要 完全 重启 。 你 浪费 了 时 间 ， 等 待 处 于 工作 
流 后 期 的 一 些 问题 重新 执行 前 面 的 步骤。 


解决 方案 

Cascalog Checkpoint (https://github.com/nathanmarz/cascalog-contrib/tree/master/cascalog. 
checkpoint) 是 一 个 优秀 的 库 ， 提 供 了 在 Cascalog 任务 中 添加 检查 点 的 能 力 。 如 果 一 步 失 
败 ， 任 务 将 从 那 一 步 重 新 开始 ， 而 不 是 从 头 再 来 。 


在 已 有 的 Cascalog 项 目 中 ， 例 如 9.2 节 “ 用 抽取 转换 加 载 (ETL) 管道 来 处 理 数据 ”中 
创建 的 项 目 ， 在 项 目 依赖 关系 中 添加 [cascalog/ cascalog-checkpoint "1.10.2"]， 将 
cookbook.checkpoiint 命名 空间 设置 为 AOT 编译 的 。 















































然后 用 Cascalog Checkpoint 的 workflow 宏 来 设置 你 的 任务 。 假 设 一 个 四 步 的 任务 看 起 来 是 
这 样 的 : 


(ns cookbook .checkpoint 
(:require [cascalog.api :refer :alLL] 
[cascalog.checkpoint :refer [workflow]])) 


(defmain Main [in-path out-path & args] 
(workflow ["/tmp/log-parsing"] 
step-1 ([:temp-dirs parsed-logs-path] 
(parse-logs in-path parsed-Logs-path)) 
step-2 ([:temp-dirs [min-path max-path]] 
(get-min parsed-logs-path min-path) 
(get-max parsed-Logs-path max-path)) 
step-3 ([:deps step-1 :temp-dirs log-sample-path] 
(sample-logs parsed-Logs-path log-sample-path)) 
step-4 ([:deps :alLL] 
(summary parsed-Logs-path 
min-path 
max-path 
log-sample-path 
out-path)))) 


讨论 
Cascalog 任务 常常 需要 几 个 小 时 来 运行 。 有 些 事情 比 打字 错误 更 令 人 诅 形 ， 它 们 会 在 最 


后 的 步骤 中 破坏 任务 ， 而 任务 已 经 运行 了 整个 周末 。Cascalog Checkpoint 提供 了 workfLow 
宏 ， 这 让 你 从 最 后 成 功 的 步 又 开始 重启 任务 。 
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workflow 宏 的 第 一 个 参数 checkpoint -dir 是 一 个 向 量 ， 包 含 一 个 路 径 ， 用 于 存放 临时 文件 。 
每 一 步 的 输出 被 临时 存放 在 该 路 径 的 目录 中 ， 还 有 一 些 文件 来 追踪 哪些 步 又 已 经 成 功 完 成 。 


在 第 一 个 参数 之 后 ，workflow 需要 几 对 步骤 名 称 和 步骤 定义 。 一 个 步骤 定义 是 一 个 选项 向 
量 ， 跟 着 该 步骤 包含 的 Cascalog 查询 ， 数 目 不 限 。 例 如 : 








step-3 ([:deps step-1 :temp-dirs [log-sample-path log-other-sample-path]] 
(sample-logs parsed-logs-path log-sample-path) 
(other-sampLe-Logs parsed-Logs-path log-other-sample-path)) 


这 个 步骤 定义 确定 了 step-3。 它 依赖 于 step-1， 所 以 它 在 step-1 完成 后 才 会 运行 。 这 个 
步骤 为 它 的 查询 创建 了 两 个 临时 目录 。:deps 和 :temp-dirs 既 可 以 是 一 个 符号 ， 也 可 以 是 
一 个 包含 符号 的 向 量 ， 或 者 可 以 省 略 。 在 选项 向 量 之 后 ， 你 可 以 包含 一 个 或 多 个 Cascalog 
查询 。 在 这 个 例子 中 ， 有 两 个 查询 。 


:deps 可 以 接受 不 同 的 值 。:1ast 是 默认 的 值 ， 让 该 步骤 依赖 于 它 前 面 的 步骤 。:alt 让 该 步 
又 依赖 于 前 面 定 义 的 所 有 步骤 。 提 供 一 个 符号 ， 或 包含 符号 的 向 量 ， 让 该 步骤 依赖 于 特定 
的 一 个 或 一 组 步 又。 步骤 只 有 在 它 依赖 的 步骤 完成 后 ， 才 会 执行 。 如 有 果 几 个 步骤 的 依赖 关 
系 都 已 满足 ， 它 们 会 并 行 执行 。 


提供 给 :temp-dirs 的 每 个 符号 都 会 被 转变 成 临时 路 径 下 的 一 个 目录 。 后 来 的 步骤 将 使 用 这 
些 目录 ， 读 取 早 期 步 又 的 输出 数据 。 在 工作 流 全 部 成 功 完成 时 ， 这 些 目 录 会 被 清理 。 在 此 
之 前 ， 这 些 目 录 将 保留 不 同步 骤 的 输出 ， 以 便 让 工作 流 能 够 从 最 后 未 完成 的 步骤 开始 继续 
执行 。 




















如 果 你 希望 重启 已 经 成 功 完成 的 步骤 ， 请 删除 <checkpoint-dir>/<step-name> 
中 的 文件 。 如 果 你 需要 删除 或 修改 其 中 的 数据 ， 步 又 定义 中 的 :temp-dirs 
可 以 在 <checkpoint-dir>/data/<temp-dir> 中 找到 。 














处 理 错 误 的 另 一 个 方法 是 为 Cascalog 查询 提供 错误 陷 井 。Cascalog 会 将 导致 查询 错误 的 输 
入 元 组 放 入 错误 陷 井 〈 进 行 不 同 的 处 理 ， 或 倒 出 供 手工 检查 )。 有 了 错误 陷 井 ， 一 些 不 良 
输入 就 不 会 让 整个 工作 流 停 下 来 。 

为 Cascalog 任务 设置 检查 点 需要 在 一 开始 多 做 一 点 工作 ， 但 它 会 为 你 节省 大 量 的 时 间 。 事 
情 会 出 错 。 集 群 会 宕 机 。 你 会 发 现 打 字 错 误 和 边界 情况 。 能 够 从 最 后 完成 的 步骤 开始 重启 
任务 ， 而 不 是 每 次 等 待 运行 所 有 的 步骤 ， 这 是 很 好 的 。 




















参阅 
。 GitHub 上 的 cascalog.checkpoint 项 目 页 面 (https://github.com/nathanmarz/cascalog-contrib/ 


tree/master/cascalog.checkpoint) 。 





A 
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9.6 解释 Cascalog 查 询 


作者 : Alex Robbins 


问题 


Cascalog 任务 运行 得 很 慢 ， 你 不 能 确定 原因 。 


解决 方案 

利用 cascalog.api/explain 函数 ， 打 印 出 查询 的 DOT 文件 。 要 继续 本 实例 ， 可 以 在 已 有 
的 项 目 中 启动 REPL， 例 如 9.2 节 “ 用 抽取 转换 加 载 (ETL) 管道 来 处 理 数 据 ” 中 创建 的 
项 目 : 























(require '[cascalog.api :refer [explain <-]]) 
(explain "slow-query.dot" (<- [?a ?b] ([[1 2]] ?a ?b))) 


接 下 来 ， 你 需要 查看 DOT 文件 。 有 许多 种 方式 查看 ， 但 最 容易 的 方式 可 能 是 利用 dot， 它 
是 Graphviz 的 工具 之 一 ， 将 DOT 文件 转 成 PNG 或 GIF 





$ dot -Tpng -osLow-query.png slow-query.dot 
现在 打开 slow-query.png (如 图 9-1 所 示 )， 看 看 查询 的 图 示 。 
讨论 
Cascalog 工作 流 编译 成 了 Cascading 工作 流 。Cascading (http:/www.cascading.org/) 是 一 个 


Java 库 ， 它 包装 了 Hadoop， 提 供 了 基于 流 的 管道 抽象 。DOT 文件 中 的 查询 图 将 包含 一 些 
不 同 的 Cascading 元 素 作 为 结 点 。 














这 里 的 explaiin 国 数 类 似 于 许多 SQL 实现 中 的 EXPLAIN 命令 。explain 导致 Cascalog 打 
印 出 查询 计划 。 就 像 SQL 的 EXPLAIN 的 输出 一 样 ， 你 必须 去 理解 看 到 的 东西 。 








询 的 某 些 部 分 。Cascalog 让 查询 复 用 变 得 很 容易 ， 但 你 常常 希望 运行 查询 ， 保 存 结 果 ， 然 
后 引用 从 其 他 查询 保存 的 结果 ， 而 不 是 每 次 用 到 它 的 输出 时 都 运行 一 次 。 





你 也 可 以 尝试 匹配 查询 计划 中 的 阶段 和 运行 的 任务 。 这 有 些 麻烦 ， 因 为 阶段 不 会 刚好 对 应 
于 输出 图 。 但 是 如 果 成 功 ， 就 能 追踪 到 慢 的 阶段 。 


一 般 来 说 ， 要 保持 Cascalog 查询 速度 ， 就 要 确保 使 用 了 集群 中 的 所 有 市 点 。 这 意味 着 让 
工作 保持 为 平均 规模 的 小 单元 。 如 果 一 个 映射 器 的 输入 花 的 时 间 是 另外 40 个 输入 的 1000 
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倍 ， 那 么 整个 任务 将 等 待 那 一 个 映射 器 完成 工作 。 将 那个 长 时 间 的 映射 任务 切 分 成 1000 
个 较 小 的 任务 ， 将 使 整个 任务 快 很 多 ， 因 为 它 能 够 分 布 到 整个 集群 ， 而 不 是 在 单个 节点 上 
和 运行。 很 容易 发 生 在 一 个 归 约 器 中 终止 几乎 整个 任务 的 情况 。 如 有 果 几 乎 所 有 的 归 约 器 都 已 
完成 工作 ， 任 务 在 等 待 一 两 个 归 约 器 ， 那 么 很 容易 在 Hadoop 任务 追踪 器 中 看 到 。 要 解决 
这 个 问题 ， 就 要 在 映射 阶段 利用 聚合 器 完成 尽 可 能 多 的 归 约 工作 ， 然 后 确保 剩 下 的 归 约 工 
作 没 有 堆积 到 少数 的 归 约 器 上 。 



































[head] 
2.2.0 


Hadoop:1.1.2:Apache 





Memory9ourceTap['Memory9ource9cheme[[UNKOWN]->[ALU]][788055b45-910d-4a9c-8c08-3efc2c118e831] 


[{7}:UNKNOWN] 
[Q}:UNKNOWN] 


Each(48b5b65c-7223-4e30-872f-6fc179b61f7c")[ldentity[decl:[{2}:?a’ ?b]]] 


[{2}:?a, ?7b 
[{2}: ab] 


Each(48b5b65c-7223-4e30-872f-6fc179b61f7c')[ClojureFilter[decl:[{2}:"?a, ?b"]]] 


[{2}: ?a, ?hb'] 
[{2}:?a, ?hb 


Each(‘48b5b65c-7223-4e30-872f-6fc179b61f7c')[Identity[decl:[{2}:?a’ ?b]]] 


[{2}:?a’ 3b] 
[人 ab 
Each(‘48b5b65c-7223-4e30-872f-6fc179b61f7c")[ClojureFilter[decl:[{2}: ?a, ‘?b"]]] 
[{2}:3a, ?b] 
[{2}:"?2a, ?b'] 
StdoutTap[’SequenceFile[[UNKOWN]->["?a, ?b"]]]["/var/folders/kh/sjty4kr92ss3nhd34rqk4_lwO000gn/T/ 
temp91749973832549848551383944437489451000'] 


[{2}:?3a, 3b 
[{2}:3a, ?b 











9-1: slow-query.png 





9.3 市 “聚合 大 型 文件 ”。 
。 Cascalog 维基 页 面 上 的 “Cascading Flow Visualization” (https://github.com/nathanmarz/ 

















cascalog/wiki/Cascading-Flow-visualization ) 。 


9.7 在 Elastic MapReduce 上 运行 Cascalog 任 务 


作者 : Alex Robbins 


问题 
你 有 大 量 数据 要 处 理 ， 但 没有 Hadoop 集群 。 


NR 
解决 方案 

亚马逊 的 Elastic MapReduce (http://aws.amazon.com/elasticmapreduce/，EMR) 提供 了 按 
需 计算 的 Hadoop 集群 。 要 使 用 EMR ， 你 需要 一 个 Amazon Web Services 账户 (http://aws. 


amazon.comy/cny/) 。 























首先 ， 像 平时 一 样 编写 一 个 Cascalog 任务 。 本 章 有 一 些 实例 能 够 帮助 你 创建 完整 的 
Cascalog 任务 。 如 果 没 有 自己 的 任务 ， 也 可 以 复制 9.2 节 “ 用 抽取 转换 加 载 (ETL) 管道 
来 处 理 数据 ”: 








$ git clone https://github.com/clojure-cookbook/cascalog-samples.git 
$ cd cascalog-samples 
$ git checkout etl-sample 


有 了 Cascalog 项 目 后 ， 打 包 成 一 个 uberjar: 


$ lein compile 
$ lein uberjar 

















接 下 来 ， 将 生成 的 JAR 上 传 到 S3 (如 果 你 按照 ETL 的 例子 做 ， 就 是 target/cookbook-0.1.0- 
SNAPSHOT-standalone.jar)。 若 你 从 未 上 传 文件 到 S3， 可 查阅 S3 文档 “Create a Bucket” 
(http://docs.aws.amazon.com/AmazonS3/latest/gsg/CreatingABucket.html) 和 “Adding an Object 





to a Bucket” (http://docs.aws.amazon.com/AmazonS3/latest/gsg/PuttingAnObjectInABucket. 
html) 。 重 复 这 一 步骤 ， 以 上 传 你 的 输入 数据 。 在 这 一 过 程 中 ， 请 留意 JAR 的 路 径 以 及 输入 
数据 的 位 置 。 











要 创建 你 的 MapReduce 任务 ， 请 访问 https:Wconsole.aws.amazon.comy/elasticmapreduce/， 选 
择 “Create New Job Flow”( 图 9-2) 在 进入 新 任务 流向 导 后 ， 选 择 “Custom JAR” 任 务 类 
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型 。 选 择 “Continue” 并 输入 你 的 JAR 的 位 置 和 参数 。“JAR Location” 就 是 前 面 通知 你 的 
S3 路 径 。“JAR Arguments” 是 执行 你 的 JAR 时 要 传 入 的 所 有 人 参数。 例如， 使 用 Cascalog 
samples 代码 库 中 的 例子 时 ， 参 数 就 是 要 执行 的 完整 限定 的 类 名 ，cookbook.etl.Main, 一 个 
包含 输入 数据 的 s3n:// URI， 和 一 个 输出 数据 的 s3n:// URI。 





接 下 来 儿 个 向 导 窗 口 让 你 为 任务 指定 附加 的 配置 选项 。 选 择 “Continue”， 直 到 到 达 复 查 
(REVIEW) 阶段 ， 然 后 开始 你 的 任务 。 








Create a New Job Flow Cancel [x 


SPECIFY PARAMETERS 
Specify the location in Amazon S3 of your JAR. Hadoop executes the JAR. You can specify its main class in its manifest. If you don't you 
must specify a class name as the first argument of the JAR. 
JAR Location*: clojure-cookbook/cookbook-0.1.0-SNAPSHOT-standalon' 


JAR Arguments*: cookbook.etl.Main 
3n://clojure-cookbook/books.json 
3n:/iclojure-cookbook/output 








< Back i * Required field 
Continue la 











图 9-2: 在 新 任务 向 导 中 指定 参数 


在 任务 运行 完 后 ， 你 应 该 能 够 从 S3 获取 结果 。Elastic MapReduce 允许 你 设置 一 个 日 志 路 
径 ， 如 果 任 务 没 有 像 预 期 那样 完成 ， 它 可 以 辅助 调试 。 


讨论 

如 果 你 有 大 的 Cascalog 任务 ， 又 不 是 经 常 需要 运行 它们 ， 亚 马 逊 的 EMR 是 一 个 很 好 的 解 
决 方案 。 维 护 自 己 的 Hadoop 集群 需要 大 量 的 时 间 和 金钱 。 如 果 你 能 让 集群 保持 很 忙 ， 这 
是 很 好 的 投资 。 如 果 每 月 只 需要 用 几 次 ， 最 好 还 是 用 EMR 的 按 需 计算 Hadoop 集群 。 





Ry 


阅 

。 9.2 节 “ 用 抽取 转换 加 载 (ETL) 管道 来 处 理 数 据 ” 了解 创建 一 个 简单 的 Cascalog 任务 。 

。 亚马逊 的 “Launch a Custom JAR Cluster” 文 档 (http://docs.aws.amazon.com/ElasticMapReduce/ 
latest/DeveloperGuide/emr-launch-custom-jar-cli.html) 。 
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测试 





10.0 简介 

今天 对 代码 正确 有 信心 是 一 回 事 ， 但 一 周 后 你 是 什么 感觉 ? 一 个 月 后 呢 ? 一 年 后 呢 ? 在 你 
离开 很 久之 后 呢 ? 为 了 找到 这 种 信心 ， 我 们 为 代码 编写 测试 。 写 得 好 的 调试 套件 对 你 自己 
和 之 后 的 开发 者 宣称 :“ 只 要 这 个 测试 通过 ， 不 论 是 现在 还 是 将 来 ， 这 就 是 应 用 程序 工作 
的 方式 。 

除了 测试 ， 一 些 其 他 的 工具 最 近 也 在 Clojure 中 出 现 ， 目 的 是 改进 程序 的 可 靠 性 。 通 常 ， 


它们 专注 于 验证 数据 是 否 符合 预期 ， 防止 程序 收 到 不 知 如 何 处 理 的 输入 。 这 些 工 具 各 式 各 
样 ， 从 简单 的 前 置 条 件 ， 到 可 选 的 静态 类 型 和 编译 时 的 代数 类 型 分 析 。 


























必须 承认 ， 现 在 测试 在 Clojure 社区 中 是 热点 话题 。 人 们 开始 质疑 这 些 调 试 是 否 值得 ， 或 
者 是 否 有 更 好 的 方式 来 考虑 程序 验证 。 近 几 年 ， 一些 技术 ， 如 REPL 驱动 的 开发 、 基 于 属 
性 的 测试 和 可 选 的 类 型 ， 已 经 异军突起 ,填补 了 测试 领域 中 大 家 看 到 的 空白 。 


本 章 介 绍 了 以 上 所 有 技术 。 尽 管 我 们 喜爱 挑战 极限 ， 但 通常 好 的 老式 单元 测试 套件 仍 是 最 
佳 选择 。 同 时 ， 随 着 我 们 创建 了 越 来 越 多 的 庞大 应 用 ， 简 单 的 单元 测试 有 时 会 不 够 ， 这 一 
点 很 清楚 。 我 们 希望 不 论 你 的 技能 水 平 或 关注 点 如 何 ， 都 能 在 本 章 中 找到 新 的 工具 ， 添 加 
到 你 的 测试 武器 库 中 。 
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10.1 单元 测试 


作者 : Daniel Gregoire 





问题 
希望 测试 Clojure 代码 的 独立 单元 。 





解决 方案 

在 clojure.test 命名 空间 中 ，Clojure 包含 了 一 个 单元 测试 框架 。 它 提供 了 一 些 方式 来 
命名 和 分 组 测试 ， 提 供 断 言 ， 报 告 结果 ， 以 及 精心 安排 测试 套件 。 为 了 示范 ， 假 设 有 一 
个 capitalize-entries 半数， 将 映射 表 中 的 值 转换 成 首 字 母 大 写 。 要 测试 该 函数 ， 就 用 
clojure.test/deftest 定义 一 个 测试 . 




















;; 命名 空间 com.example.core 中 的 一 个 函数 
(defn capitalize-entries 
"Returns a new map with values for keys 'ks' in the map 'm' capitalized." 


[m & ks] 
(reduce (fn [m k] (update-in m [k] clojure.string/capitalize)) m ks)) 


;; The corresponding test in namespace com.example.core-test 
(require '[clojure.test :refer :all]) 





;; 在 真正 的 测试 命名 空间 ， 你 也 会 :refer 所 有 的 目标 命名 空间 


;; (require '[com.example.core :refer :alLL]) 








(deftest test-capitalize-entries 
(Let [employee {:last-name "smith" 
:job-title "engineer" 
:level 5 
:office "seattle"}] 
;; Passes 
(is (= (capitalize-entries employee :job-title :last-name) 
{:job-title "Engineer" 
:last-name "Smith" 
:office "seattle" 


:level 5})) 
;; Fails 
(is (= (capitalize-entries employee :office) 
{})))) 


用 clojure.test/run-tests 国 数 来 运行 测试 ， 


(run-tests) 

;; -> {:type :summary, :pass 1, :test 1, :error 0, :fail 1} 
;; *OUt* 

;; Testing user 


233 





;; FAIL in (test-capitalize-entries) (NO_SOURCE_FILE:13) 

;; expected: (= (capitalize-entries empLoyee :office) {}) 

oe actual: (not (= {:last-name "smith", :office "Seattle", 
Ea :level 5, :job-title "engineer"} {})) 
;; Ran 1 tests containing 2 assertions. 

;; 1 failures, 0 errors. 


讨论 


前 面 的 例子 对 clojure.test 提供 的 单元 测试 功能 只 是 浅 尝 辑 止 。 让 我 们 以 从 下 向 上 的 方 








式 ， 看 看 它 的 其 他 功能 。 





首先 ， 可 以 改进 断言 失败 时 的 报告 ， 提 供 第 二 个 参数 ， 解 释 该 断言 的 测试 意图 。 如 果 运 行 





这 个 测试 ， 就 会 看 到 一 段 扩展 的 描述 ， 说 明代 码 预期 的 行为 : 


(is (= (capitalize-entries {:office "space"} :office) {}) 
"The employee's office entry should be capitalized.") 
;; -> false 
3 oUt 
;; FAIL in clojure.lang.PersistentList$EmptyList@1 (NO_SOURCE_FILE:1) 
;; The employee's office entry should be capitalized. 
;; expected: (= (capitalize-entries {:office "space"} :office) {}) 
;; actuaL: (not (= {:office "Space"} {})) 





为 了 全 面 测试 像 capitalize-entries 这 样 的 函数 ， 需 要 考虑 儿 种 用 例 。 要 更 精确 地 测试 大 











量 的 类 似 用 例 ， 请 使 用 clojure.test/are 宏 : 


(deftest test-capitalize-entries 
(let [employee {:last-name "smith" 
:job-title "engineer" 
:level 5 
:office "seattle"}] 
(are [ks m] (= (apply capitalize-entries employee ks) m) 
[] employee 
[:not-a-key] employee 
[:job-title] {:job-title "Engineer" 
:last-name "smith" 
:level 5 
:office "seattle"} 
[:last-name :office] {:Last-name "Smith" 
:office "Seattle" 
:level 5 
:job-title "engineer"}))) 





are 的 前 两 个 参数 建立 起 了 一 种 测试 模式 给 定 一 系列 的 键 ks 以 及 一 个 映射 表 nm， 





键 和 原来 的 empLoyee 映射 表 调 用 capitaLize-entries， 断 言 返回 值 等 于 m。 




















用 描述 式 语法 编写 多 个 用 例 ， 更 容易 捕捉 错误 和 未 处 理 的 边界 情况 ， 例 如 对 于 前 


[:not-a-key] employee 断言 对 ， 会 抛 出 NullPointerException。 





用 这 些 





下 测试 的 
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不 像 其 他 流行 动态 语言 的 测试 框架 ，Clojure 内 建 的 断言 最 少 而 且 简 单 。is 和 are 宏 检查 


测试 表达 式 是 否 为 “ 真 ”( 也 就 是 说 ， 如 果 这 些 表达 式 返 回 











的 既 不 是 false 也 不 是 niL， 测 


试 就 通过 )。 此 外 ， 也 可 以 检查 thrown? 或 thrown-with-msg?， 测 试 某 个 预期 的 java.Lang . 
Throwable (错误 或 异常 ) : 


(is (thrown? IndexOutOfBoundsException (nth [] 1))) 





在 单个 断言 的 层面 之 上 ，clojure.test 也 提供 一 些 机 制 ， 在 测试 运行 之 前 或 之 后 调用 一 
些 国 数 。 在 test-capitalize-entries 测试 中 ， 我 们 定义 了 一 个 随意 的 employee 映射 表 
来 测试 ,但 也 可 以 注册 一 个 数据 加 载 函 数 作为 “测试 装置 ”(fixture)， 读 入 外 部 数据 ， 
在 多 个 测试 中 共享 。Clojure.test/use-fixfures 的 多 重 方法 允许 Clojure 注册 函数 可 以 在 测 
试 前 后 被 调用 ， 或 在 整个 命名 空间 的 测试 套件 前 后 调用 。 下 面 的 例子 定义 六 
测试 装置 函数 : 


你 可 以 认为 测试 装置 函数 构成 了 一 个 管道 ， 























(require '[clojure.edn :as edn]) 
(def test-data (atom nil)) 


;; 假定 你 有 一 个 test-data.edn 文件 …… 

(defn load-data "Read a Clojure map from test data in a file." 
[test-fn] 
(reset! test-data (edn/read-string (slurp "test-data.edn"))) 
(test-fn)) 


(defn add-test-id "Add a unique id to the data before each test." 
[test-fn] 
(swap! test-data assoc :id (java.util.UUID/randomUUID)) 
(test-fn)) 


注册 了 三 个 


(defn inc-count "Increment a counter in the data after each test runs." 


[test-fn] 
(test-fn) 
(swap! test-data update-in [:count] (fnil inc 0))) 


(use-fixtures :once load-data) 
(use-fixtures :each add-test-id inc-count) 


;; Tests... 





每 个 测试 作为 一 个 参数 通过 它 ， 在 前 面 的 例子 








中 我 们 将 测试 称 为 test-fn。 以 inc-count 为 例 。 这 个 测试 装置 的 任务 是 调用 test-fn 图 
继续 这 个 管道 ， 然 后 增加 计数 〈 即 “做 一 些 工 作 ”")。 每 个 测试 装置 决定 是 在 自己 的 工 
作 之 前 还 是 之 后 调用 test-fn (请 比较 add-test-id 函数 和 inc-count 函数 )， 
test/use-fixtures 多 重 方 法 则 实现 控制 ， 决 定 每 个 注册 的 测试 装置 函数 对 于 命名 空间 中 的 
所 有 测试 只 运行 一 次 ， 还 是 对 每 个 测试 运行 一 次 。 


数 ， 








而 clojure. 


最 后 ， 在 深刻 理解 了 如 何 开 发 单个 Clojure 测试 套件 之 后 ， 你 要 考虑 作为 项 目 构建 的 一 部 
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分 ， 如 何 组 织 和 运行 这 些 套件 ， 这 一 点 很 重要 。 尽 管 Clojure 允许 在 代码 集 的 任何 地 方 定 
义 函 数 的 测试 ， 但 你 应 该 将 测试 代码 放 在 一 个 独立 的 目录 ， 只 在 需要 的 时 候 (例如 开发 
和 测试 的 时 候 ) 才 添 加 到 JVM 类 路 径 中 。 根 据 被 测试 的 命名 空间 来 命名 测试 的 命名 空间 
会 比较 方便 ， 这 样 位 于 <project-root>/src/com/example/core.clj 的 文件 ， 命 名 空间 是 com. 
example.core， 对 应 的 测试 文件 在 <project-root>/test/com/example/core_test.clj， 命 名 空间 是 
com.example.core-test。 要 控制 源 代码 的 位 置 和 测试 代码 的 路 径 ， 以 及 是 否 包含 在 JVM 
类 路 径 中 ， 你 应 该 使 用 Leiningen (http://leiningen.org/) 或 Maven (http://maven.apache 




















org/) 这 样 的 构建 工具 来 组 织 你 的 项 目 。 














F 夹 ， 你 可 以 在 命 





在 Leiningen 中 ， 测 试 代码 的 默认 的 目录 是 顶层 的 <project-root>/test 文 从 


令 行 用 Lein test 来 运行 项 目的 测试 。 不 带 附加 的 参数 ，Lein test 命令 将 执行 项 目 中 所 有 


的 测试 : 
$ lein test 


lein test com.example.core-test 
lein test com.example.util-test 


Ran 10 tests containing 20 assertions. 
0 failures, 0 errors. 




















要 限制 Leiningen 运行 测试 的 范 目 
名 称 : 


# 运行 整个 命名 空间 
$ lein test :onLy com.example.core-test 


三 


lein test com.example.core-test 


Ran 5 tests containing 10 assertions. 
0 failures, 0 errors. 


# 运行 某 个 特定 的 测试 


$ lein test :only com.example.core-test/test-capitalize-entries 


lein test com.example.core-test 


Ran 1 tests containing 2 assertions. 
0 failures, 0 errors. 


参阅 


单元 测试 框架 的 全 部 信息 。 























， 就 用 :only 选项 ， 带 上 完全 限定 的 命名 空间 或 函数 


了 该 


。 如 果 你 使 用 的 是 Maven， 就 用 clojure-maven-plugin (https://github.com/talios/clojure- 
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maven-plugin) 来 运行 Clojure 测试 。 这 个 插件 将 合并 Maven 标准 的 src/test/clojure 目录 
中 的 Clojure 测试 ， 作 为 Maven 构建 生命 周期 中 test 阶段 的 一 部 分 。 你 可 以 选择 性 地 
使 用 该 插件 的 clojure:test-with-junit 目标 ,为 Clojure 测 试 生 成 JUnit 风格 的 报告 输出 。 














10.2 ”用 Midje 测 试 

作者 : Joseph Wilk 

问题 

希望 对 一 个 函数 进行 单元 测试 ， 它 集成 了 外 部 依赖 关系 ， 如 HTTP 服务 或 数据 库 。 
解决 方案 


使 用 Midje (https://github.com/marick/Midje)， 它 是 一 个 测试 框架 ， 提 供 了 一 些 方 法 来 模拟 
国 数 ， 返 回 假 结果 。 要 继续 本 实例 ， 用 lein-try 启动 REPL : 























$ lein try midje clj-http 





这 是 一 个 示例 函数 ， 它 发 出 HTTP 请 求 : 


;; Com.example.core 命名 空间 中 的 一 个 函数 
(require '[clj-http.client :as http]) 


(defn github-profile [username] 
(Let [response (http/get (str "https://api.github.com/users/" username))] 
(when (= (:status response) 200) 
(:body response)))) 


(github-profile "clojure-cookbook") 
;; -> "{\"Llogin\":\"clojure-cookbook\",\"id\":4176246, ...}" 


要 测试 github-profile 函数 ， 就 在 对 应 的 测试 命名 空间 中 ， 用 midje.sweet/facts 和 
midje.sweet/fact 定义 一 个 测试 . 


;; 在 com.example.core-test 命名 空间 中 ……: 
(require '[midje.sweet :refer :all]) 





(facts "about successful requests" 

(fact "returns the response body" 
(github-profile "clojure-cookbook") => . .body.. 
(provided 

(http/get #"/users/clojure-cookbook") => 
{:status 200 :body ..body..}))) 





讨论 
在 Midje 中 ，facts 将 一 段 描述 和 一 组 测试 关联 起 来 ， 而 fact 映射 到 你 的 测试 。fact 中 的 
断言 三 ， 形式 为 : 





;; actual => expected 














10 => 10 ; 这 会 通过 
10 => 11 ; 这 会 失败 


断言 的 行为 与 大 多 数 济 试 框架 有 一 点 不 同 。 在 fact 主体 内 ， 每 个 断言 都 得 到 检查 ， 不 论 
前 面 的 断言 是 否 失败 。 











站 
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Midje 只 提供 模拟 (mock)， 不 提供 桩 (stub)。provided 主体 内 指定 的 所 有 函数 都 必须 被 
调用 ， 测 试 才能 通过 。 模 拟 与 断言 使 用 了 同样 的 语法 ， 但 含意 稍 有 不 同 : 


;; <function call & arguments to match> => <return vaLue of function> 


(provided (+ 10 10) => 0) 


注意 ， 这 里 你 不 是 要 调用 (+ 19 19) 函数 ， 而 是 设置 了 一 个 模式 ， 这 一 点 很 重要 。 测 试 中 
出 现 的 每 个 函数 调用 都 得 到 检查 ， 看 看 它 是 否 匹 配 这 个 模式 。 如 果 确 实 匹 配 ，Midje 不 会 
调用 该 函数 ， 而 是 返回 90。 在 如 何 匹配 模拟 函 数 和 真正 调用 方面 ， 和 provided 来 定义 模拟 
国 数 非常 灵活 。 例 如 ， 在 前 面 的 解决 方案 中 ， 使 用 了 正则 表达 式 。 这 个 表达 式 告 诉 Midje 
模拟 对 http/get 的 调用 ， 只 要 URL 以 /users/clojure-cookbook 结尾 。 























;; 预期 

(http/get #"/users/clojure-cookbook$") 

;; 将 匹配 

(http/get "http://localhost:4001/users/clojure-cookbook") 
;; 或 


(http/get "https://api.github.com/users/clojure-cookbook") 











Midje 提供 了 许多 匹配 形状 的 函数 ， 可 以 用 来 匹配 模拟 函数 的 参数 : 





;; 匹配 包含 1 的 参数 列表 
(provided 
(http/get (contains [1])) => :result) 





;; 匹配 一 个 定制 的 fn， 它 必定 返回 true 
(provided 
(http/get (as-checker (fn [x] (x == 10)))) => :result) 











;; 匹配 单个 参数 ， 可 以 是 任何 值 
(provided 
(http/get anything) => :result) 
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在 REPL 中 ， 你 可 以 研究 所 有 Midje 的 检查 器 : 


(require 'midje.repl) 
(doc midje-checkers) 
;3 类 OU 

;; midje.sweet/midje-checkers 
;; (facts "about checkers" 
2 (f) => truthy 

池 (f) => falsey 


2 (f) => irrelevant ; or ‘anything. 

人 (f) => (exactly odd?) ; when you expect a particular function 
(f) => (roughly 10 0.1) 

3 (f) => (throws SomeException #"with message") 

3 (f) => (contains [1 2 3]) ; works with strings, maps, etc. 


2 (f) => (contains [1 2 3] :in-any-order :gaps-ok) 

和 (f) => (just [1 2 3]) 

4 (f) => (has every? odd?) 

的 (f) => (nine-of odd?) ; must be exactLy 9 odd values. 

es (f) => (every-checker odd? (roughly 9)) ; both must be true 
Pe (f) => (some-checker odd? (roughly 9))) ; one must be true 





你 可 能 已 经 注意 到 ， 在 解决 方案 中 ， 我 们 用 了 ..body.. 而 不 是 真正 的 响应 。 这 就 是 Midje 
所 请 元 常数 (metaconstant ) 。 





元 常数 是 任何 用 两 个 点 开始 和 结束 的 名 字 。 除 标识 外 ， 它 设 有 其 他 属性 。 可 以 把 它 看 成 是 
假 结果 或 占 位 符 ， 我 们 不 关心 它 的 实际 值 ， 或 者 它 可 能 被 目前 还 不 存在 的 内 容 替 换 掉 。 在 
我 们 的 例子 中 ， 我 们 并 不 关心 . .body.. 是 什么 ， 我 们 只 关心 它 是 返回 的 内 容 。 


要 在 原 有 的 项 目 中 添加 Midje， 就 在 开发 依赖 关系 中 添加 [midje "1.5.1"]， 在 开发 插件 中 
添加 [lein-midje "3.1.2"]。 你 的 project.clj 应 该 看 起 来 像 这 样 : 
































(defproject example "1.0.0-SNAPSHOT" 
:profiles {:dev {:dependencies [[midje "1.5.1"]] 
:plugins [[lein-midje "3.1.2"]}}) 


Midje 提供 了 两 种 方式 来 运行 测 | 试 : 通过 REPL， 就 像 你 可 能 已 经 在 做 的 那样 ， 或 者 通过 
Leiningen。Midje 实际 上 鼓励 你 通过 REPL， 站 了 所 有 测试 。 运 行 测试 有 一 种 


很 有 用 的 方法 ， 就 是 用 midje.repL/autotest 函数 。 它 不 断 轮 询 文件 系统 ， 寻 找 项 目 中 的 
变更 。 如 果 检 测 到 这 些 变化 ， 就 会 自动 重新 运行 相关 的 测试 





























(require '[midje.repl :as midje]) 
(midje/autotest) ; Start auto-testing 


;; Other options are... 
(midje/autotest :pause) 
(midje/autotest :resume) 
(midje/autotest :stop) 











有 了 Midje， 你 还 可 以 在 REPL 中 做 许多 事情 。 要 了 解 更 多 信息 ， 就 在 REPL 中 运行 (doc 
midje-repL) ， 阅 读 midje-repl 的 文档 字符 串 。 








你 也 可 以 通过 Leiningen 的 插件 lein-midje 〈 像 前 面 提 到 的 在 project.clj 中 添加 ) 来 运行 
Midje。lein-midje 允许 你 以 不 同 的 粒度 来 运行 测试 ， 即 所 有 测试 、 一 个 组 中 的 所 有 测试 ， 
或 一 个 命名 空间 中 的 所 有 测试 


UW 


Ar 间 


Wh 


运行 所 有 的 测试 


lein midje 


运行 一 组 命名 空间 中 的 测试 


lein midje com.example.* 


# 运行 某 个 特定 命名 空间 中 的 测试 


$ lein midje com.example.t-core 


10.1 市 “单元 测试 *"， 了 解 在 Clojure 中 进行 更 多 基本 单元 测试 的 信息 。 








。 Midje 的 GitHub 代码 库 (https://github.com/marick/Midje)。 


10.3 通过 随机 输入 进行 彻底 测试 


作者 : Luke VanderHart 


的 题 
望 利 用 随机 生成 的 输入 来 测试 一 个 函数 ， 确 保 它 在 所 有 可 能 的 场景 下 都 能 工作 。 








解决 方案 





用 test.generative 库 来 指定 函数 的 输入 ， 用 随机 生成 的 值 来 测试 它 。 


要 继续 本 实例 ， 用 lein-try 启动 REPL: 


了 


下 














$ lein try org.clojure/test.generative "0.5.0" 


假定 你 打算 测试 下 面 的 函数 ， 它 计算 一 个 序列 中 所 有 数字 的 算术 平均 值 : 





























(defn mean 


"Calculate the mean of the numbers in a sequence" 
[s] 
(/ (reduce + s) (count s))) 


面 的 test.generative 代码 为 mean 函数 定义 了 一 个 规格 说 明 (specification) : 
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(require '[clojure.test.generative :as t] 
'[clojure.test.generative.runner :as r] 
'[clojure.data.generators :as gen]) 


(defn number 
"Return a random number, of a random type" 
[] 
(gen/one-of gen/byte 
gen/short 
gen/int 
gen/Long 
gen/float 
gen/double)) 


(defn seq-of -numbers 
"Return a list, seq, or set of numbers" 
[] 
(gen/one-of (gen/list number) 
(gen/set number) 
(gen/vec number))) 


(t/defspec mean-spec 
mean 
[^example.generative-tests/seq-of -numbers arg] 
(assert (number? %))) 


要 运行 mean-spec 规格 说 明 ， 就 调用 clojure.test.generative.runner 命名 空间 中 的 run 国 
数 ， 传 入 运行 模拟 的 线程 数 ， 运 行 的 毫秒 数 ， 以 及 指向 规格 说 明 的 var: 

















下 面 是 我 们 在 REPL 中 运行 前 面 例子 的 情形 : 


(r/run 2 5000 #'example.generative-tests/mean-spec) 
;; -> clojure.lang.ExceptionInfo: Generative test failed 


这 显示 了 生成 式 测 试 失败 的 行为 。 失 败 的 准确 细节 被 作为 Clojure 信息 承载 异常 (infor 
mation-bearing exception) 的 数据 返回 ， 你 肯定 会 收 到 该 异常 的 实例 ， 对 它 调 用 ex-data 将 
返回 数据 映射 表 。 

在 REPL 中 ， 如 果 疫 有 明确 地 捕捉 该 异常 ， 可 以 用 特殊 的 *e 符号 来 取得 最 近 的 异常 。 对 它 
调用 ex-data， 将 返回 引起 错误 的 测试 用 例 的 信息 : 





(ex-data *e) 

;; -> {:exception #<ArithmeticException java.lang.ArithmeticException: 
ee Divide by zero>, :iter 7, :seed -875080314, 

3 :example.generative-tests/mean-spec, :input [#{}]} 


这 表明 ， 仅 在 7 次 迭代 后 ， 使 用 随机 数 种 子 -875080314， 被 测 函 数 传 入 了 #{} 作为 输入 ， 
抛 出 除数 为 0 的 错误 。 


用 这 种 方式 突出 后 ， 问 题 很 容易 发 现 。 如 果 (count s) 为 0，mean 国 数 将 发 生 除数 为 0 的 





情况 。 重 写 mean 国 数 来 处 理 这 种 情况 ， 修 复 该 缺陷 : 


(defn mean 
[s] 
(if (zero? (count s)) 
0 
(/ (reduce + 1.0 s) (count s)))) 


重新 运行 ， 显 示 测 试 通过 : 


(r/run 2 5000 #'example.generative-tests/mean-spec) 
;; -> {:iter 3931, :seed -1495229764, :test testgen-test.core/mean-spec} 
{:iter 3909, :seed -1154113663, :test testgen-test.core/mean-spec} 


这 个 输出 表明 ， 在 分 配 的 5 秒 种 内 ， 两 个 线程 各 自 跑 了 约 3900 次 测试 迭代 ， 没 有 遇 到 任 
何 错误 或 断言 失败 。 


讨论 
前 面 的 测试 定义 中 有 两 个 关键 部 分 : defspec 形式 本 身 (定义 了 生成 式 测 试 )， 以 及 用 于 生 
成 随机 数据 。 在 这 个 例子 中 ， 数 据 生 成 器 函数 基于 clojure.data.generators 命名 空间 中 的 


生成 器 函数 没有 参数 ， 返 回 随 机 值 。 不 同 的 函数 生成 不 同类 型 的 数据 。clojure.data. 
generators 命名 空间 包含 了 所 有 Clojure 原生 类 型 和 集合 的 生成 器 函数 。 它 也 包含 了 一 些 
函数 ， 随 机 地 从 一 组 选项 中 选择 。 例 如 ， 前 面 使 用 的 one-of 函数 ， 它 接受 一 些 生 成 器 函 
数 ， 从 中 随机 选择 一 个 值 。 


defspec 宏 接 受 三 类 形式 : 一 个 待 测 函 数 ， 一 个 参数 规格 说 明 ， 以 及 一 个 主体 ， 包 含 一 个 
或 多 个 断言 形式 。 

待 测 函数 就 是 要 调用 的 国 数 。 在 生成 式 测 试 的 过 程 中 ， 它 将 被 调用 许多 次 ， 每 次 都 用 不 同 
的 值 。 


























参数 规格 说 明 是 一 个 包含 参数 名 称 的 向 量 ， 应 该 匹配 被 测 函 数 的 签名 。 每 个 参数 都 应 该 
附 有 元 数据 。 具 体 来 说 ， 它 应 该 有 :tag 元 数据 键 ， 映射 到 一 个 生成 器 函数 的 完全 限定 名 
称 。 每 次 测试 驱动 器 调用 该 函数 时 ， 它 将 使 用 每 个 参数 的 随机 值 ， 该 值 来 自 对 应 的 生成 
器 函数 。 














为 何 用 :tag ? 
你 可 能 对 使 用 :tag 元 数据 有 一 点 困惑 。 通 常 ，:tag 是 一 个 类 型 上 暗示， 返回 一 个 JVM 
类 。 在 test.generative 中 ， 它 应 该 是 一 个 函数 ， 返 回 你 想 传 递 给 被 测 函 数 的 任何 类 
型 的 值 。 
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用 这 种 方式 来 复 用 :tag， 主 要 是 出 于 历史 原因 。test.generative 主要 是 受到 QuickCheck 
库 的 启发 ， 该 库 是 用 Haskell 写 的 。 因 为 Haskell 是 强 类 型 和 静态 类 型 的 ， 所 以 
QuickCheck 确实 通过 类 型 签名 就 足以 明白 如 何 生 成 输入 数据 。 

在 Clojure 中 ， 这 种 联系 没有 那么 强 ， 有 可 能 更 令 人 困惑 。 只 要 记 住 ， 在 test.genera 
tive 的 上 下 文中 ，:tag 不 是 指 实际 的 系统 类 型 ， 而 是 指 一 个 函数 ， 它 返回 一 个 类 型 的 
对 象 ， 而 该 类 型 正 是 你 想 传 递 给 被 测 函 数 的 。 











defspec 的 主体 只 是 包含 一 些 表 达 式 ， 它 们 在 某 些 条 件 不 请 足 时 抛 出 异常 。 它 在 每 次 测试 
和 迭代 时 都 被 执行 ， 带 上 可 用 的 、 已 经 实例 化 的 参数 ， 并 让 被 测 函 数 的 返回 值 绑 定 到 多 。 简 
单 起 见 ， 这 个 例子 只 有 一 个 断言 ， 判 断 结 果 是 一 个 数字 ， 但 你 可 以 有 任意 数量 的 断言 ， 执 
行 任 何 检查 。 


test.generative 与 传统 的 单元 测试 之 间 有 一 个 有 趣 的 区 别 ， 它 不 er 
等 待 他 们 运行 完 ， 而 是 指定 运行 的 时 间 ， 系 统 将 在 这 段 时 间 内 ， 运 行 尽 可 能 多 的 、 随 机 排 
列 的 测试 。 这 样 就 能 保证 测试 运行 时 间 是 确定 的 ， 让 你 能 根据 情况 ， 0 
中 。 例 如 ， 你 可 以 在 开发 时 让 测试 运行 5 秒 钟 ， 但 每 个 晚上 用 一 小 时 的 时 间 ， 在 持续 集成 
服务 器 上 全 面 锤 打 该 系统 ， 找 出 可 能 性 为 百 万 分 之 一 的 缺陷 ( 毫 不 夸张 )。 


0 

在 开发 测试 时 ， 通 过 REPL 运行 通常 是 最 方便 的 。 但 是 ， 还 有 许多 其 他 场景 (如 测试 提 

交 钧 子 (commit oe 或 在 CI 服务 器 上 )， 需 要 通过 命令 行 运 行 测试 。 出 于 这 个 目的 ， 

test.generative 在 clojure.test.generative.runner 命名 空间 提供 了 一 个 -maiin 函数 ， 接 
受 一 个 或 多 个 目录 作为 命令 行 参数 ， 从 中 找到 生成 式 测试 。 它 在 这 些 位 置 的 所 有 Clojure 

命名 空间 中 查找 生成 式 测 试 规格 说 明 ， 并 执行 它们 。 


例如 ， 如 果 你 将 生成 式 测试 放 在 Leiningen 项 目的 tests/generative 目录 ， 就 可 以 在 项 目的 根 
目录 下 ， 运 行 下 面 的 命令 来 执行 测试 : 



















































































$ lein run -m clojure.test.generative.runner tests/generative 


如 果 你 希望 控制 测试 运行 的 强度 ， 可 以 通过 clojure.test.generative.threads 和 cloj 
ure.test.generative.msec JVM 系统 属性 ， 调 整 并 发 线程 数 和 运行 的 时 间 。 使 用 Leiningen 
时 ， 你 必须 在 project.clj 的 :jvm-opts 键 中 设置 这 些 选 项 ， 像 这 样 : 











:jvm-opts ["-Dclojure.test.generative.threads=32" 
"-Dclojure. test.generative.msec=10000"] 


clojure. test.generative.runner/-main 将 取得 用 这 种 方式 提供 的 参数 ， 并 根据 它们 来 运行 。 
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阅 

GitHub 上 的 test.generative 页 面 (https://github.com/clojure/test.generative)。 
QuickCheck Haskell 库 (http://hackage.haskell. rg/packaaelQuick heck) 

10.4 节 “ 寻 找 导 致 失败 的 值 ” ,探讨 了 SimpleCheck, 它 是 一 个 基于 属性 的 Clojure 测试 库 ， 
与 test.generative 有 一 些 重 琶 ,还 有 一 些 独特 的 功能 。 


10.4 寻找 导致 失败 的 值 


作者 : Luke VanderHart 





























希望 指定 函数 的 一 些 属性 ， 它 们 对 于 所 有 的 输入 都 保持 为 真 ， 并 找 出 违反 这 些 属性 的 输入 值 。 


解决 方案 
使 用 simple-check 人 这 是 针对 Clojure 的 一 个 属 
性 规格 说 明 库 ， 它 能 够 “缩小 ”输入 的 情况 ， 找 出 导致 失败 的 最 小 输入 。 


要 继续 本 实例 ， 就 在 项 目 依赖 关系 中 添加 [reiddraper/simple-check "0.5.3"]， 或 用 
REPL 启动 lein-try: 











$ lein try reiddraper/simple-check 


然后 ， 找 一 个 函数 来 测试 。 这 个 例子 使 用 了 一 个 编造 的 函数 ， 它 计算 一 系列 数字 的 倒数 
之 和 : 


(defn reciprocal-sum [s] 
(reduce + (map (partial / 1) s))) 





下 面 是 测试 代码 本 身 : 


7 











(require '[simple-check.core :as sc] 
'[simple-check.generators :as gen] 
'[simple-check.properties :as prop]) 


(def seq-of -numbers (gen/one-of [(gen/vector gen/int) 
(gen/list gen/int)])) 


(def reciprocal-sum-check 
(prop/for-all [s seq-of-numbers] 
(number? (reciprocal-sum s)))) 








注 1: 要 注意 ，simple-check 找 的 是 “局 部 ”最 小 ， 而 非 “ 全 局 ”最 小 ， 这 一 点 很 重要 。 
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seq-of -numbers 是 数据 生成 器 ， 由 simple-check.generators 命名 空间 中 的 原生 数据 生成 器 
构成 。 





不 像 test.generative，simple-check 的 生成 器 不 是 一 个 返回 值 的 函数 ， 它 
们 更 复杂 。 它 们 是 一 些 数 据 结构 ， 不 仅 定 义 了 随机 值 如 何 产 生 ， 而 且 定 义 了 
它们 如 何 尾 盖 “ 最 简单 ”的 可 能 失败 的 场景 。 











全 面 讨论 创建 定制 的 simple-check 生成 器 (而 不 是 原生 生成 器 的 简单 组 
合 ) 超出 了 本 实例 的 范围 ， 但 可 以 在 simple-check 的 GitHub 页 面 (https:// 
github.com/reiddraper/simple-check) 上 找到 完整 的 文档 。 








实际 的 测试 是 用 simple-check.properties/for-all 宏 定义 的 ， 它 产生 一 种 属性 定义 。 它 接 
受 一 种 绑 定形 式 (类 似 于 let 或 for)， 指 定 一 些 可 能 的 值 绑 定 到 一 个 或 多 个 符号 ， 并 接受 
一 个 主体 。 主 体 中 实际 指定 了 必须 保持 的 属性 ， 它 们 必须 返回 true， 这 是 一 组 特定 的 值 能 
够 通过 测试 的 充 要 条 件 。 











下 


要 运行 测试 ， 就 调用 simple-check.core/quick-check 函数 ， 向 它 传 递 定义 的 属 | 





(sc/quick-check 100 reciprocal-sum-check) 


quick-check 接受 一 些 样本 和 属性 定义 来 执行 。 属 性 定义 的 主体 将 被 反复 抽样 检查 ， 采 用 
一 些 随 机 值 ， 它 们 绑 定 到 绑 定 形式 指定 的 那些 符号 上 。 

















你 也 许 已 经 注意 到 ，reciprocaL-sum 国 数 有 一 个 问题 : 如 果 0 出 现在 输入 序列 中 ， 它 会 抛 
出 “除数 为 0” 的 错误 。quick-check 返回 一 个 数据 结构 ， 展 示 了 这 个 问题 : 


{:result 
#<ArithmeticException java.lang.ArithmeticException: Divide by zero>, 
:failing-size 8， 
:Num-tests 9， 
:fail [(500 -8 1 -2)]， 
:shrunk 
{:total-nodes-visited 10， 
:depth 5， 
:result 
#<ArithmeticException java.lang.ArithmeticException: Divide by zero>， 
:smallest [(0)]}} 


消除 0 值 ， 修 复 该 函数 : 
(defn reciprocal-sum [s] 


(reduce + (map (partial / 1) 
(filter (complement zero?) s)))) 


重新 运行 测试 ， 现 在 它 成 功 了 : 








(sc/quick-check 100 reciprocal-sum-check) 
;; -> {:result true, :num-tests 100, :seed 1384622907885} 


讨论 

simple-check 有 一 个 非常 有 用 的 特点 ， 它 不 仅 返 回 导 致 测试 失败 的 输入 样本 ， 而 且 返 回 最 
小 的 失败 样本 。 例 如 ， 在 前 面 的 示例 程序 中 ， 每 次 输入 序列 中 出 现 0 时 ， 都 会 导致 失败 。 
但 是 ， 仅 仅 查 看 序列 (5 6 6 -8 1 -2)， 也 许 不 能 明显 发 现 0 是 问题 。 如 果 不 了 解 被 测 函 
数 的 细节 ， 也 许 会 觉得 问题 可 能 出 在 负数 ， 或 5。simpte-check 返回 的 不 是 任意 的 失败 输 
入 ， 而 是 具体 的 输入 ， 它 总 是 导致 程序 失败 。 知 道 有 一 个 输入 会 导致 失败 ， 这 很 有 用 ， 但 
更 有 用 的 是 知道 具体 导致 问题 的 值 。 而 且 ， 函 数 的 输入 越 大 越 复 杂 ， 能 缩小 出 错 的 范围 就 
越 有 用 。 














test.generative 和 simple-check 


你 可 能 已 经 注意 到 ，test.generative (在 10.3 节 探 讨 ) 和 simple-check 有 许多 共同 
点 。 它 们 都 生成 随机 分 布 的 输入 数据 ， 它 们 者 指定“ 成功” 的 条 件 ， 方式 都 是 对 所 有 
输入 和 输出 必须 成 立 的 属性 或 品质 ， 而 不 是 具体 的 实例 。 


但 是 ， 存 在 一 些 关键 的 区 别 。simple-check 在 返回 之 前 让 失败 的 输入 最 小 化 ， 而 test 
generative 在 第 一 次 遇 到 失败 时 就 失败 。 但 是 ，test.generative 的 数据 生成 器 是 简单 
的 函数 ， 没 有 额外 指定 的 行为 ， 这 让 它们 更 灵活 、 更 容易 扩展 。 

test.generative 不 仅 能 指定 测试 运行 多 少 次 迭代， 而 且 能 指定 测试 运行 多 长 时 间 ， 在 
分 配 的 时 间 框 架 中 ， 利 用 多 线程 运行 尽 可 能 多 的 测试 。 

最 后 ， 它 们 都 是 有 价值 的 方法 ， 如 果 你 真 想 彻 底 测 试 某 个 函数 ， 应 该 认真 考虑 它们 。 
用 哪个 应 该 取决 于 你 自己 的 具体 需求 : 输入 有 多 大 或 多 复杂 ， 需 要 对 运行 时 间 有 怎样 
的 控制 ， 扩 展 生 成 原生 数据 集 的 可 能 性 有 多 少 。 











参阅 


。 10.1 节 “ 单 元 测试 ”。 
。 10.3 节 “ 通 过 随机 输入 进行 彻底 测试 ”。 
。 simple-check 的 项 目 页 下 














(https://github.com/reiddraper/simple-check) 。 





。 “Introduction to QuickCheck” (http://www.haskell.org/haskellwiki/Introduction_to_ 
QuickCheck2)， 了 解 启 发 simple-check 的 Haskell 库 的 更 多 信息 。 


10.5 ”运行 基于 浏览 器 的 测试 


作者 : Matthew Maravillas 
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希望 运行 基于 浏览 器 的 测试 。 


a 
解决 方案 

通过 clj-webdriver 库 (https://github.com/semperos/clj-webdriver) 使 用 Selenium WebDriver。 
这 让 你 能 在 真实 的 浏览 器 环境 中 ， 用 clojure.test 来 测试 应 用 程序 的 行为 。 








要 继续 本 实例 ， 就 创建 一 个 新 的 Leiningen 项 目 : 


$ lein new browser-testing 
Generating a project called browser-testing based on the 'default' template. 





修改 新 项 目的 project.clj 文件 ， 像 下 面 这 样 : 











下 





(defproject browser-testing "0.1.0-SNAPSHOT" 
:profiles {:dev {:dependencies [[clj-webdriver "0.6.0"]]}} 
:test-selectors {:default (complement :browser) 
:browser :browser}) 


接 下 来 ， 在 test/browser_testing/core_test.clj 中 添加 一 个 简单 的 Selenium 测试 ， 禾 写 它 的 
内 容 : 


(ns browser-testing.core-test 
(:require [clojure.test :refer :alLL] 
[clj-webdriver .taxi :as t])) 


;; 简单 的 测试 装置 ， 建 立 一 个 测试 驱动 器 
(defn selenium-fixture 
[& browsers] 
(fn [test] 
(doseq [browser browsers] 
(println (str "\n[ Testing " browser " ]")) 
(t/set-driver! {:browser browser}) 
(test) 
(t/quit)))) 





(use-fixtures :once (selenium-fixture :firefox)) 


(deftest ^:browser test-clojure 
(t/to "http://clojure.org") 


(is (= (t/title) "Clojure - home")) 
(is (= (t/current-url) "http://example.com/"))) 


(deftest ^:browser test-clojure-download 
(t/to "http://clojure.org") 
(t/click {:xpath "//div[@class='menuyu']/*/a[ltext()='Download']"}) 


(is (= (t/title) "Clojure - downloads")) 





(is (= (t/current-url) "http://clojure.org/downloads")) 
(is (re-find #"Rich Hickey" (t/text {:id "foot"})))) 


这 个 代码 库 的 完整 版 本 在 GitHub (https://github.com/clojure-cookbook/browser- 
testing) 上 。 在 本 地 签 出 一 份 副本 ， 跟 上 我 们 的 进度 : 


$ git clone https://github.com/clojure-cookbook/browser-testing 
$ cd browser-testing 








在 命令 行 运行 测试 ， 





$ lein test :browser 

lein test browser-testing.core-test 

[ Testing :firefox ] 

lein test :only browser-testing.core-test/test-clojure 


FAIL in (test-clojure) (core_ test.clj:20) 
expected: (= (t/current-url) "http://example.com/") 
actual: (not (= "http://clojure.org/" "http://example.com/")) 


Ran 2 tests containing 5 assertions. 
1 failures, 0 errors. 
Tests failed. 


讨论 
浏览 器 济 试 验证 应 用 程序 的 行为 与 在 目标 浏览 器 中 一 致 。 它 们 测试 应 用 程序 的 外 观 和 行 
为 ， 就 像 在 浏览 器 中 泻 染 一 样 。 


在 浏览 器 中 手工 测试 应 用 是 乏味 的 重复 任务 。 即 使 对 于 普通 规模 的 项 目 ， 完 成 测试 所 需 的 
时 间 和 工作 量 也 可 能 无 法 管理 。 自 动 化 浏览 器 测试 确保 它们 一 致 地 运行 ， 并 且 相 对 比较 
快 ， 导 致 可 重 现 的 错误 和 更 频 和 党 的 测试 。 但 是 ， 自 动 化 测试 缺少 人 的 视觉 检查 ， 这 是 手工 
测试 所 固有 的 。 例 如 ， 手 工 测 试 可 以 很 容易 地 捕捉 一 些 定位 错误 ， 而 自动 化 测试 可 能 就 会 
漏 掉 ， 除 非 明 确 地 对 位 置 进行 测试 。 


























要 在 Clojure 中 编写 浏览 器 测试 ， 就 用 clj-webdriver 库 和 你 喜欢 的 测试 框架 ， 如 clojure. 
test。clj-webdriver 为 Selenium WebDriver 提供 了 一 个 简洁 的 Clojure 接口 ，WebDriver 
是 一 个 工具 ， 用 于 控制 和 自动 化 浏览 器 的 动作 。 需 要 一 些 附加 的 配置 ， 才 能 使 用 Selenium 
WebDriver 或 clj-webdriver 和 你 选择 的 浏览 器 。 参 见 Selenium WebDriver 的 文档 (http:// 
code.google.com/p/selenium) 和 clj-webdriver 的 维基 页 面 (http://github.com/semperos/clj- 


webdriver/wiki ) 。 


在 深 入 测试 之 前 ， 你 可 以 先 在 REPL 中 尝试 clj-webdriver。 用 lein-try 开始 一 次 尝试 
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cLj-webdriver 的 REPL 


$ lein try clj-webdriver "0.6.0" 





利用 clj-webdriver .taxi/set-driver! 图 数 ， 选 择 Firefox WebDriver 实现 (其 他 选项 包 
括 :chrome 或 :ie, 但 它们 可 能 需要 更 多 设置 ) : 





(require '[clj-webdriver.taxi :as t]) 


(t/set-driver! {:browser :firefox}) 
;; -> #clj webdriver.driver.Driver{:webdriver ...} 





这 将 打开 你 选择 的 浏览 器 ， 等 待 接 收 命令 。 请 尝试 clj-webdriver .taxi 命名 空间 中 的 一 些 
数 : 


可 诡 


(t/to "http://clojure.org/") 


(t/current-url) 
;; -> "http://clojure.org/" 


(t/title) 
;; -> "Clojure - home" 


(t/click {:xpath "//div[@class='menuy']/*/a[text()='Download']"}) 
(t/current-url) 
;; -> "http://clojure.org/downloads" 


(t/text {:id "foot"}) 
;; -> "Copyright 2008-2012 Rich Hickey" 


在 完成 后 ， 从 REPL 中 关闭 浏览 器 : 
(t/quit) 


你 的 测试 将 使 用 这 些 函 数 来 启动 浏览 器 ， 并 针对 它 运行 。 为 了 省 点 事 ， 你 应 该 用 clojure. 
test 的 测试 装置 来 设置 浏览 器 启动 和 结束 时 的 处 理 。 




















T 








clojure.test/use-fixtures 让 你 在 每 个 独立 测试 前 后 运行 函数 ， 或 者 将 整个 命名 空间 的 测 
试 作为 一 个 整体 ， 在 它 前 后 运行 函数 。 请 使 用 后 一 种 方式 ， 因 为 每 个 测试 都 重启 浏览 器 会 
慢 很 多 。 
selenium-fixture 国 数 使 用 clj-webdriver 的 set-driver! 函数 来 启动 浏览 器 ， 该 浏览 器 
由 提供 给 它 的 关键 字 指 定 ， 然 后 在 浏览 器 中 运行 命名 空间 中 的 测试 ， 再 用 quit 函数 关闭 
浏览 器 : 





























(defn selenium-fixture 
[& browsers] 
(fn [test] 
(doseq [browser browsers] 





(t/set-driver! {:browser browser}) 
(test) 
(t/quit)))) 


(use-fixtures :once (selenium-fixture :firefox)) 
使 用 :once 测试 装置 意味 着 浏览 器 的 状态 在 各 个 测试 之 间 是 保持 的 ， 注 意 这 一 点 很 重要 。 
根据 具体 应 用 程序 的 行为 ， 在 编写 测试 时 需要 确保 这 一 点 ， 让 每 个 测试 从 一 个 共同 的 浏览 
器 状态 开始 。 例 如 ， 你 可 能 删除 所 有 cookie 或 返回 某 个 顶层 页 面 。 如 果 有 必要 ， 你 可 能 觉 
得 需要 将 这 种 共同 的 复位 行为 作为 :each 测试 装置 。 
要 开始 编写 测试 ， 请 修改 项 目的 project.clj 文件 ， 在 :dev 特性 描述 中 包含 clj-webdriver， 
并 在 :test-selectors 中 加 上 方便 的 :default 和 browser 




















(defproject my-project "1.0.0-SNAPSHOT" 
:profiles {:dev {:dependencies [[clj-webdriver "0.6.0"]]}} 
:test-selectors {:defauLt (complement :browser) 
:browser :browser}) 


测试 选择 器 让 你 单独 执行 几 组 测试 。 这 能 防止 较 慢 的 浏览 器 测试 影响 较 快 的 、 更 经 常 运行 
的 单元 测试 和 底层 集成 测试 。 








在 这 个 例子 中 ， 你 添加 了 一 个 新 选择 器 ， 并 修改 了 默认 值 。 新 的 :browser 选择 器 只 匹 
配 用 :browser 元 数据 键 标 注 的 那些 测试 。 默 认 的 选择 器 现在 将 排除 带 有 这 种 标注 的 所 
有 测试 。 


有 了 测试 装置 和 测试 选择 器 ， 就 可 以 开始 编写 测试 了 。 从 简单 的 开始 : 























(deftest ^:browser test-clojure 
(t/to "http://clojure.org/") 


(is (= (t/title) "Clojure - home")) 
(is (= (t/current-url) "http://example.com/"))) 





请 注意 ，^:browser 元 数据 附 在 测试 上 。 这 个 测试 被 标注 为 一 个 浏览 器 测试 ， 只 有 在 选择 
那个 测试 选择 器 时 才 会 运行 。 

在 这 个 测试 中 ， 就 像 在 REPL 实验 中 一 样 ， 你 导航 到 一 个 URL， 检 查 它 的 标题 和 URL。 
在 命令 行 执 行 这 个 测试 ， 向 lein test 传递 附加 的 测试 选择 器 参数 ， 





$ lein test :browser 
lein test browser-testing.core-test 


[ Testing :firefox ] 
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lein test :onLy browser-testing.core-test/test-clojure 


FAIL in (test-clojure) (core_test.cLj:20) 
expected: (= (t/current-url) "http://example.com/") 
actual: (not (= "http://clojure.org/" "http://example.com/")) 


Ran 2 tests containing 5 assertions. 
1 failures, 0 errors. 
Tests failed. 





很 清楚 ， 这 个 测试 必然 失败 。 用 http://clojure.org/ 代替 http://example.com/， 它 将 

















这 个 测试 非常 基础 。 在 大 多 数 真实 测试 中 ， 你 加 载 一 个 URL， 与 页 画 
序 的 行为 符合 预期 。 编 写 另 一 个 测试 与 该 页 面 交 互 : 


交互 ， 并 验证 应 用 程 








(deftest ^:browser test-clojure-download 
(t/to "http://clojure.org") 
(t/click {:xpath "//div[@class='menuyu']/*/a[ltext()='Download']"}) 


(is (= (t/title) "Clojure - downloads")) 
(is (= (t/current-url) "http://clojure.org/downloads")) 
(is (re-find #"Rich Hickey" (t/text {:id "foot"})))) 


在 这 个 测试 中 ， 在 加 载 URL 后 ， 浏 览 器 受命 点 击 用 一 个 XPath 选择 器 定位 的 锚 。 为 了 验 


证 预期 的 页 面 已 被 加 载 ， 测 试 比较 了 标题 和 URL， 就 像 在 第 一 个 测试 中 一 样 。 最 后 ， 它 找 
到 包含 版 本 信息 的 好 oot 元 素 的 文本 内 容 ， 并 验证 该 文本 包含 了 预期 的 名 称 。 




















clj-webdriver 提供 了 许多 其 他 功能 ， 实 现 与 应 用 的 交互 。 更 多 的 信息 ， 参 见 clj-webdriver 
的 维基 页 面 (http://github.com/semperos/clj-webdriver/wiki) 。 


参阅 

。 clj-webdriver 的 GitHub 代码 库 (https://github.com/semperos/clj-webdriver) 和 维基 页 面 。 
。 Selenium 的 项 目 页 面 (http://code.google.com/p/selenium)。 

。 10.1 节 “ 单 元 测试 ， 了 解 在 Clojure 中 进行 单元 测试 的 更 多 信息 。 


10.6 ”追踪 代码 执行 


作者 : Stefan Karlsson 





























希望 追踪 代码 执行 ， 以 便 了 解 它 在 做 什么 。 











解决 方案 


利用 tools.trace 库 (https://github.com/clojure/tools.trace) 的 一 群 “追踪 ”函数 和 宏 ， 在 


代码 运行 时 进行 检查 。 











在 开始 之 前 ， 先 在 :development 特性 描述 中 添加 [org.clojure/tools.trace "0.7.6"] 作 


为 项 目 依赖 关系 (在 [:profiles :dev :dependencies] 路 径 的 向 量 中 ， 而 不 是 [:depen 


dencies] 路 径 ) ; 或 者 ， 用 lein-try 启动 REPL : 


$ lein try org.clojure/tools.trace 








(require '[clojure.tools.trace :as t]) 


(map #(inc (t/trace %)) 
(range 3)) 

;; -> (1 2 3) 

;; *OUt* 

;; TRACE: 0 

;; TRACE: 1 

;; TRACE: 2 





在 执行 时 要 检查 单个 值 ， 就 用 clojure.tools.trace/trace 调用 来 包装 该 值 : 





要 检查 多 个 值 ， 又 不 丢失 追踪 的 上 下 文 ， 明 白 追 踪 的 是 哪个 值 ， 就 为 trace 提供 一 个 描述 





性 的 名 称 字符 串 作为 第 一 个 参数 : 


(defn divide 
[n d] 
(/ (t/trace "numerator" nN) 
(t/trace "denominator" d))) 


(divide 4 6) 

;; -> 2/3 

;; *OUt* 

;; TRACE numerator: 4 
;; TRACE denominator: 6 


讨论 


tools.trace 的 核心 ， 就 是 关于 反省 一 段 代码 的 执行 。 


操作 。 将 一 个 值 包装 在 trace 调用 中 将 完成 两 件 事 : 








第 一 是 将 追踪 信息 记录 到 STDOUT， 














trace 函数 是 最 简单 的 、 最 底层 的 追踪 


第 二 





也 是 最 重要 的 ， 原 封 不 动 地 返回 原来 的 值 。tools.trace 还 提供 了 其 他 一 些 粒 度 的 追踪 执行 。 














从 简单 值 提 升 一 个 层次 ， 你 可 以 用 clojure.tools.trace/deftrace 代 赫 defn 来 定义 函数 ， 





以 便 追 踪 该 函数 的 输入 和 输出 : 


(t/deftrace pow [x n] 
(Math/pow x n)) 
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(pow 2 3) 

;; -> 8.0 

;; *out* 

;; TRACE t815: (pow 2 3) 
;; TRACE t815: => 8.0 





不 建议 部 署 带 有 追踪 的 产品 代码 。 追 踪 最 适合 开发 和 调试 ， 尤 其 是 在 REPL 
中 。 请 将 tools.trace 放 在 project.clj 的 :dev 特性 描述 中 ， 让 追踪 仅 在 开发 
任务 中 可 用 。 

















如 果 你 试图 诊断 一 个 非常 难 理解 的 表达 式 ， 请 使 用 clojure.tools.trace/trace-forms 宏 来 
包装 表达 式 ， 查 明 异 常 的 原因 。 如 果 没 有 异常 ，trace-forms 就 没有 和 输出， 正常 返回 : 

















(t/trace-forms (* (pow 2 3) 
(divide 1 (- 1 1)))) 
2» Kout* 


;; ArithmeticException Divide by zero 
se Form failed: (divide 1 (- 1 1)) 
Form failed: (* (pow 2 3) (divide 1 (- 1 1))) 
;; Clojure.lang.Numbers.divide (Numbers.java:156) 


除了 明确 追踪 值 或 函数 ，tools.trace 让 你 动态 追踪 var 或 整个 命名 空间 。 要 为 var 增加 追 


踪 功 能 ， 就 用 clojure.tools.trace/trace-vars。 要 移 除 这 样 的 追踪 ， 就 用 clojure. tools. 
trace/untrace-vars: 


(defn add [x y] (+ x y)) 


(t/trace-vars add) 

(add 2 2) 

;; ->4 

;; *OUt* 

;; TRACE t1309: (user/add 2 2) 
;; TRACE t1309: => 4 


(t/untrace-vars add) 
(add 2 2) 


;; ->4 


要 追踪 或 取消 追踪 整个 命名 空间 ， 就 分 别 用 clojure.tools.trace/trace-ns 和 clojure. 
tools.trace/untrace-ns。 这 将 为 命名 空间 中 所 有 的 函数 和 var 动态 地 添加 或 移 除 追 踪 。 在 
调用 trace-ns 之 后 定义 的 所 有 东西 都 会 被 追踪 : 


(def my-inc inc) 
(defn my-dec [n] (dec n)) 


(t/trace-ns 'user) 


(my-inc (my-dec 0)) 





;; ->0 

;; TRACE t1217: (user/my-dec 0) 

;; TRACE t1218: | (user/my-dec 0) 
;; TRACE t1218: | => -1 

;; TRACE t1217: => -1 

;; TRACE t1219: (user/my-inc -1) 
;; TRACE t1220: | (user/my-inc -1) 
;; TRACE t1220: | => 0 

;; TRACE t1219: => 0 


(t/untrace-ns 'user) 

(my-inc (my-dec 0)) 

;; ->0 
阅 
tools.trace 的 GitHub 代码 库 (https://github.com/clojure/tools.trace)， 了 解 追 踪 函 数 和 
宏 的 完整 列表 。 


10.7 用 core.typed 避 人 免 空 指针 异 


作者 : Ambrose Bonnaire-Sergeant 


wh 


问题 
望 验证 代码 正确 地 处 理 了 nil， 消 除了 潜在 的 空 指针 异常 。 
解决 方案 
用 core.typed (https://github.com/clojure/core.typed)， 它 是 针对 Clojure 的 一 个 可 选 类 型 系 
统 。 用 它 来 标注 命名 空间 ， 检 查 误 用 的 nil。 





要 继续 这 个 实例 ， 就 创建 一 个 文件 core_typed_samples.clj， 并 用 lein-try 启动 REPL: 


$ touch core_typed_samples.clj 
$ lein try org.clojure/core.typed 





这 个 实例 与 其 他 实例 有 点 不 同 ， 因 为 core.typed 利用 磁盘 文件 来 检查 命名 
空间 。 








例如 ,假设 你 要 写 一 个 函数 handle-number 来 处 理 数据 。 为 了 验证 handle-number 正确 地 处 
理 了 nil， 用 clLojure.core.typed/ann 标注 它 接受 nil 和 Number 类 型 的 联合 (U)， 返 回 一 
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个 Number : 


(ns core-typed-sampLes 
(:require [clojure.core.typed :refer [ann] :as t])) 


(ann handle-number [(U nil Number) -> Number]) 
(defn handle-number [a] 
(+ a 20)) 


在 REPL 中 用 clojure.core.typed/check-ns 来 验证 该 函数 的 正确 性 : 


User=> (require '[clojure.core.typed :as t]) 

User=> (t/check-ns 'core-typed-samples) 

# 

Type Error (core-typed-samples:6:3) Static method cLojure.Lang.Numbers/add 
could not be applied to arguments: 


Domains : 
t/AnyInteger t/AnyInteger 
java.Lang.Number java.Lang.Number 


Arguments : 
(U nil java.Lang.Number) (Value 20) 


Ranges: 
t/AnyInteger 


java. lang.Number 


with expected type: 
java. lang.Number 


in: (clojure.lang.Numbers/add a 20) 
in: (clojure.lang.Numbers/add a 20) 


ExceptionInfo Type Checker: Found 1 error clojure.core/ex-info (core.clj:4327) 





当前 的 定义 是 不 安全 的 。check-ns 意识 到 + 只 能 处 理 数字 ， 而 handle-number 国 数 接受 数 
字 或 nil。 
保护 对 + 的 调用 ， 将 它 包装 在 if 语句 中 ，a 为 nil 时 返回 0: 


(ns core-typed-samples 
(:require [clojure.core.typed :refer [ann] :as t])) 





(ann handle-number [(U nil Number) -> Number]) 
(defn handle-number [a] 
(if a 
(+ a 20) 
0)) 


再 用 check-ns 检查 该 命名 空间 : 





User=> (t/check-ns 'core-typed-samples) 
# ... 
:ok 





既然 现在 不 会 不 小 心 将 nil 传递 给 + 了 ， 空 指针 异常 也 不 可 能 出 现 了 。 


讨论 

core.typed 的 设计 目的 是 避免 在 类 型 代码 中 误 用 nil 或 null。 要 做 到 这 一 点 ， 空 指针 和 引 
用 类 型 的 概念 是 分 开 来 的 。 这 与 Java 不 同 ， 在 Java 中 ，java.lang.Number 这 样 的 类 型 意味 
着 可 以 为 “ 空 ”。 


在 core.typed 中 ， 引 用 类 型 意味 着 不 可 为 空 。 要 表达 一 个 可 为 空 的 类 型 (例如 前 面 的 例 
子 )， 就 要 构造 一 个 联合 类 型 ， 包 含 期 望 的 类 型 和 ntL。 例 如 ，java.Lang.Number 在 core. 
typed 的 语法 中 是 不 可 为 空 的， 联合 类 型 (U_ nil java.lang.Number) 表示 等 同 于 可 空 的 
java.lang.Number (后 面 这 种 表示 方法 与 Java 类 型 语法 中 的 java.Lang.Number 最 为 接近 )。 





























这 种 概念 上 的 分 离 让 core.typed 在 遇 到 可 能 误 用 nil 时 ， 抛 出 一 个 类 型 错误 。 前 面 的 解决 
方案 中 ， 在 对 等 价 表 达 式 (+ nil 29) 进行 类 型 检查 时 ， 抛 出 了 类 型 错误 。 
要 更 好 地 理解 core.typed 类 型 错误 ， 就 要 注意 一 些 拥 有 内 联 (inline) 定义 的 函数 。core. 


typed 在 类 型 检查 之 前 ， 先 完全 展开 所 有 代码 ， 所 以 当 用 户 代码 调用 clojure.core/+ 时 ， 
常常 在 类 型 错误 中 看 见 对 Java 方法 clojure.Lang.Numbers/add 的 调用 。 



































在 类 型 错误 中 还 常常 看 到 有 序 的 交叉 函数 类 型 (ordered intersection function type) 。 我 们 
的 第 一 个 类 型 错误 声称 参数 (U Number nil) 和 (Value 29) 不 属于 任何 一 个 有 序 的 交 又 函 
数 类 型 域 ， 这 些 域 在 “Domains” 下 列 出 。 请 注意 ， 提 供 了 两 个 “Ranges” ， 它 们 对 应 于 
列 出 的 域 。 





clojure.lang.Numbers/add 的 完整 类 型 是 ， 


(Fn [t/AnyInteger t/AnyInteger -> t/AnyInteger] 
[Number Number -> Number]) 








简单 来 说 ， 该 函数 是 “有 序 的 ”， 因 为 它 试图 匹配 参数 类 型 和 每 一 组 可 能 的 参数 ， 直 到 匹 
配 为 止 。 


参阅 

。 GitHub 上 core.typed 的 主页 (https://github.com/clojure/core.typed)。 

。 core.typed 的 API 参考 (http://clojure.github.io/core.typed/, 尤其 是 核心 类 型 别名 的 列表 ， 
例 如 ，clojure.core.typed/AnyInteger 的 条 目 ，http://clojure.github.io/core.typed/#clojure. 
core.typed/AnyInteger) 。 
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。 Types 的 维基 页 面 (https://github.com/clojure/core.typed/wiki/Types), 记录 了 合法 的 类 型 。 
。 10.8 节 “ 用 core.typed 验证 Java 互 操 作 ”, 以 及 10.9 节 “ 用 core.typed 检查 高 阶 函 数 ”， 
进一步 了 解 使 用 core.typed 的 例子 。 


10.8 用 core.typed 验 证 Java 互 操作 


作者 : Ambrose Bonnaire-Sergeant 


问题 
希望 验证 对 Java 库 的 使 用 是 安全 的 、 无 二 义 的 。 


解决 方案 
Java 提供 了 一 个 巨大 的 生态 系统 ， 这 对 于 Clojure 开发 者 是 主要 的 吸引 。 但 是 ， 从 Clojure 
中 使 用 大 型 和 的、 麻烦 的 Java API， 常 常 是 复杂 的 。 





要 对 Java 互 操作 调用 进行 类 型 检查 ， 就 用 core.typed。 
要 继续 本 实例 ， 先 创建 文件 core_typed_samples.cj ， 并 用 Lein-try 启动 REPL: 


$ touch core_typed_samples.clj 
$ lein try org.clojure/core.typed 











这 个 实例 与 其 他 实例 有 点 不 同 ， 因 为 core.typed 利用 磁盘 文件 来 检查 命名 


空间 。 





为 了 说 明 ， 选 择 一 个 标准 的 Java API 函数 ， 例 如 java.io.File 构造 方法 。 


利用 圆 点 构造 方法 来 创建 新 的 文件 可 能 很 烦人 ， 所 以 将 它 包装 在 一 个 Clojure 函数 new- 
file 中 ， 接 受 一 个 字符 品 参 数 : 





(ns core-typed-samples 
(:require [clojure.core.typed :refer [ann] :as t]) 
(:import (java.io File))) 


(ann new-file [String -> Filel]) 


(defn new-file [s] 
(File. s)) 


在 编译 这 个 命名 空间 时 设置 *warn-on-reflection*， 这 将 告诉 我 们 ， 存 在 对 java.io.File 
构造 方法 的 反射 调用 。 在 REPL 中 用 clojure.core.typed/check-ns 检查 这 个 命名 空间 ， 将 





392 | 第 10 章 


报告 同样 的 信息 ， 不 过 是 以 类 型 错误 的 形式 : 


User=> (require '[clojure.core.typed :as t]) 

User=> (t/check-ns 'core-typed-samples) 

站 

ExceptionInfo Internal Error (core-typed-samples:6) 
Unresolved constructor invocation java.io.File. 


Hint: add type hints . 


in: (new java.io.File s) clojure.core/ex-info (core.clj:4327) 


添加 一 个 类 型 暗示 来 调用 public Fite(String pathname) (http://docs.oracle.com/javase/7/ 
docs/api/java/io/File.html#File (java.lang.String)) 构造 方法 : 
(ns core-typed-samples 


(:require [clojure.core.typed :refer [ann] :as t]) 
(:import (java.io File))) 


(ann new-file [String -> File]) 


(defn new-file [^String s] 
(File. s)) 


再 次 检查 ，core.type 得 到 满足 了 : 
User=> (t/check-ns 'core-typed-samples) 
4 
:ok 


File 还 有 第 二 个 单 参数 的 构造 方法 : public File(URI uri)。 增 强 new-file 来 支持 URI 或 
String 文件 名 : 





(ns core-typed-samples 
(:require [clojure.core.typed :refer [ann] :as t]) 
(:import (java.io File) 
(java.net URI) )) 


(ann new-file [(U URI String) -> FiLe]) 
(defn new-file [s] 
(if (string? s) 
(File. ^String s) 
(File. ^URI s))) 
即使 将 输入 类 型 放宽 为 (U URI String)，core.typed 通过 string? 谓词 ,仍然 能 够 推断 每 
个 分 支 拥有 正确 的 类 型 。 


讨论 
虽然 java.io.File 是 比较 小 的 API， 但 也 需要 仔细 检查 Java 的 类 型 和 文档 ， 才 能 对 正确 使 
用 外 部 的 Java 代码 有 信心 。 
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尽管 File 的 构造 方法 相当 无 害 ， 但 假设 要 编写 file-parent， 它 是 getParent 方法 的 一 层 
注 薄 的 包装 : 








(ns core-typed-samples 
(:require [clojure.core.typed :refer [ann] :as t]) 
(:import (java.io File))) 


(ann file-parent [File -> String]) 
(defn file-parent [^File f] 
(.getparent f)) 














看 的 实现 避免 了 反射 调用 ， 那 么 这 样 就 安全 了 吗 ? 没有 。 用 core.typed 来 检查 这 个 函数 
另 一 种 结果 。Java 的 返回 类 型 是 “可 为 空 的 ”，core.typed 知道 这 一 点 。getParent 可 能 
回 ntL， 而 不 是 String 




















讽 各 性 





User=> (t/check-ns 'core-typed-samples) 

和 

Type Error (core-typed-samples:7:3) Return type of instance method 
java.io.File/getParent is (U java.Lang.String nil), expected 

java. lang.String. 


Hint: Use ‘non-nil-return. and ‘nilable-param. to configure where 
‘nil’ is allowed in a Java method call. ‘method-type prints the 
current type of a method. 

in: (.getParent f) 

Type Error (core-typed-samples:6) Type mismatch: 


Expected: java. lang.String 


Actual: (U String nil) 
in: (.getParent f) 


Type Error (core-typed-samples:6:1) Type mismatch: 
Expected: (Fn [java.io.File -> java.lang.String]) 


Actual: (Fn [java.io.File -> (U String nil)]) 
in: (def file-parent (fn* ([f] (.getParent f)))) 


ExceptionInfo Type Checker: Found 3 errors clojure.core/ex-info ... 


core.typed 假定 所 有 的 方法 都 返回 可 为 空 的 类 型 ， 所 以 parent 标注 为 [File -> String] 
是 一 个 类 型 错误 。 前 面 每 个 错误 都 在 说 ， 标 注 试图 将 (U nil String) 声明 为 String， 最 具 
体 的 (最 有 用 的 ) 错误 排 在 第 一 。 








core.typed 的 设计 目的 是 对 Java 代码 持 悲观 态度 ， 同 时 又 足够 准确 ， 避 免 添 加 任意 的 代码 
来 “取悦 ”类 型 检查 器 。 例 如 ，core.typed 不 相信 Java 方法 ， 所 以 默认 假定 所 有 方法 的 参 
数 都 是 不 可 为 空 的 ， 并 且 返 回 类 型 是 可 以 为 空 的 。 另 一 方面 ，core.typed 知道 Java 构造 方 
法 从 不 返回 null。 
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如 果 你 觉得 core.typed 太 斐 观 ， 不 应 该 认为 返回 类 型 可 以 为 空 ， 那 么 你 可 以 用 clojure. 
core.typed/non-nil-return 禾 写 特定 的 方法 。 将 下 面 的 代码 添加 到 前 面 的 代码 中 ， 类 型 检 
查 就 会 成 功 (简便 起 见 ， 检 查 就 省 略 了 ) : 

















(t/non-nil-return java.io.File/getName :all) 


在 本 书 编写 时 ，core.typed 没有 在 运行 时 强制 静态 类 型 重 载 ， 所 以 使 用 
non-nil-return 和 类 似 功 能 时 要 小 心 。 

















有 时 候 ， 类 型 检查 器 似乎 过 分 挑 易 ， 在 前 面 的 解决 方案 中 ， 需 要 两 个 类 型 暗示 的 构造 方 
法 。 在 动态 类 型 的 语言 中 ， 简 单调 用 (File. s) 并 让 反射 来 解决 二 义 性 的 问题 ， 这 似乎 很 
正常 。 但 是 ， 通 过 满足 core.typed 的 预期 ， 关 于 构造 方法 的 所 有 二 义 性 都 消除 了 ， 插 入 的 
类 型 暗示 让 Clojure 编译 器 能 产生 高 效 的 字 节 码 。 














为 什么 同时 需要 类 型 暗示 和 core.typed 标注 ， 才 能 对 有 二 义 的 Java 调用 进行 类 型 检查 ? 
产生 这 个 疑问 很 自然 。 类 型 暗示 是 给 编译 器 的 指令 ， 而 类 型 标注 只 是 让 core.typed 在 类 型 
检查 时 使 用 ，core.typed 不 会 影响 编译 时 的 解决 反射 调用 ， 所 以 它 选择 假定 所 有 的 反射 调 
用 都 是 有 二 义 的 ， 而 不 会 去 猜测 哪些 反射 调用 可 能 在 运行 时 解决 。 这 个 简单 的 规格 通常 导 
臻 更 快 、 更 明确 的 代码 ， 在 较 大 的 代码 集中 通常 希望 如 此 。 














参阅 

。 GitHub 上 的 core.typed 主页 (https://github.com/clojure/core.typed)。 

。 core.typed 的 API 参考 (http://clojure.github.io/core.typed/)， 尤 其 是 non-nil-return 和 
nilable-paran 的 文档 。 

。 10.7 节 “ 用 core.typed 避免 空 指针 异常 ， 以 及 10.9 市 “用 core.typed 检查 高 阶 函 数 ”， 
了 解 如 何 使 用 core.typed 的 更 多 例子 。 

















10.9 用 core.typed 检 查 高 阶 函数 
作者 : Ambrose Bonnaire-Sergeant 
问题 


Clojure 强烈 建议 使 用 高 阶 函 数 ， 但 验证 其 使 用 的 工具 关注 于 运行 时 的 验证 。 你 希望 更 早 的 
反馈 信息 ， 最 好 是 在 编译 时 。 





测试 | 395 


解决 方案 
用 core.typed 对 高 阶 函 数 进 行 类 型 检查 。 
要 继续 本 实例 ， 先 创建 文件 core_typed_samples.cj ， 并 用 Lein-try 启动 REPL: 


$ touch core_typed_samples.clj 
$ lein try org.clojure/core.typed 











这 个 实例 与 其 他 实例 有 点 不 同 ， 因 为 core.typed 利用 磁盘 文件 来 检查 命名 


空间 。 





为 了 展示 core.typed 的 能 力 ， 先 定义 一 个 有 类 型 的 高 阶 函 数 hash-of?， 它 接受 两 个 谓词 ， 
返回 一 个 新 谓词 。 





用 clojure.core.typed/fn> 返回 一 个 匿名 函数 ， 并 带 有 类 型 标注 : 





(ns core-typed-samples 
(:require [clojure.core.typed :refer [ann fn>] :as t])) 


(ann hash-of? [[Any -> Any] [Any -> Any] -> [Any -> Any]]) 
(defn hash-of? [ks? vs?] 
(fn> [m :- Any] 
(when (map? m) 
(and (every? ks? (keys m)) 
(every? ks? (vals m)))))) 


hash-of? 的 每 个 参数 类 型 都 是 [Any -> Any]， 即 一 个 单 参数 的 函数 ， 接 受 任意 类 型 ， 返 回 
任意 类 型 。 














验证 符合 前 面 类 型 标注 的 hash-of? 是 正确 的 : 





User=> (require '[clojure.core.typed :as t]) 
User=> (t/check-ns 'core-typed-samples) 
:ny 

:ok 


用 clojure.core.typed/cf 宏 ， 可 以 在 REPL (或 在 测试 中 ) 对 单个 形式 进行 类 型 检查 。 用 
两 个 谓词 来 调用 hash-of?， 输 出 得 到 的 类 型 : 

user=> (require '[core-typed-samples :refer [hash-of?]]) 

user=> (t/cf (hash-of? number? number?)) 


(Fn [Any -> Any]) 


但 是 ， 将 + 作为 谓词 传 入 ， 就 是 类 型 错误 : 





User=> (t/cf (hash-of? + number?)) 
Type Error (user:1:7) Type mismatch: 


Expected : (Fn [Any -> Any]) 


Actual: (Fn [t/AnyInteger * -> t/AnyInteger] 
[java.Lang.Number * -> java.lang.Number]) 


ExceptionInfo Type Checker: Found 1 error clojure.core/ex-info (core.clj:4327) 


这 是 因为 hash-of? 接受 一 个 带 Any 参数 的 函数 ， 而 + 至 少 要 接受 一 个 Number。 


讨论 
要 定义 能 够 快速 失败 的 函数 ， 虽 然 Clojure 内 建 的 前 置 / 后 置 条 件 是 有 用 的 ， 但 这 些 检查 只 
能 在 运行 时 提供 反馈 。 了 类 型 检查 ? core.typed 的 类 型 检查 能 力 
不 只 限于 数据 类 型 ， 它 也 能 对 函数 进行 类 型 检查 ， 就 像 对 类 型 一 样 。 


Ba 





tt 








用 clojure.core.typed/fn> 形式 替代 fn， 来 创建 并 返回 一 个 匿名 函数 ， 就 有 可 能 利用 core. 
typed 的 丰富 类 型 检查 系统 来 标注 函数 对 象 。 在 用 fn> 来 定义 函数 时 ， 用 :- 操作 符 来 标注 参数 
的 类 型 。 例 如 ，(t/fn> [m :- Map] .….) 表示 一 个 匿名 函数 ， 它 接受 一 个 Map 作为 其 唯一 参数 。 
































除了 定义 ， 从 REPL 中 检查 类 型 也 很 有 用 。clojure.core.typed/cf 宏 是 一 个 多 功能 的 、 面 
向 REPL 的 工具 ， 可 以 按 需 进行 类 型 检查 。 它 不 仅 对 检查 你 的 代码 有 用 ， 也 可 用 于 研究 内 
建 的 函数 。 对 任何 一 个 Clojure 高 阶 函 数 调用 cf ， 都 会 揭示 它们 的 类 型 签名 : 




















User=> (t/cf iterate) 
(ALL [x] 
(Fn [(Fn [x -> x]) x -> (clojure.lang.LazySeq x)])) 








环绕 iterate 类 型 的 All 表明 ,x 中 存在 多 态 。 念 起 来 是 这 样 的 :“ 对 于 所 有 类 型 x， 接 受 
一 个 函数 ， 它 接受 x 并 返回 x， 并 接受 一 个 x， 返 回 x 的 惰性 序列 。 


如 果 将 数目 错误 的 参数 传递 给 一 个 函数 ， 它 又 被 男 一 个 函数 返回 ，cf 宏 也 可 以 检测 : 











user=> (t/cf (fn [] ((hash-of? + number?)))) 
Type Error (user:1:15) Type mismatch: 


Expected : (Fn [Any -> Any]) 
Actual: (Fn [t/AnyInteger * -> t/AnyInteger] 

[java.Lang.Number * -> java.lang.Number]) 
in: ((core-typed-samples/hash-of? clojure.core/+ clojure.core/number?)) 
Type Error (user:1:14) Wrong number of arguments, expected 1 fixed 
parameters, and got 0 for function [Any -> Any] and arguments [] 


in: ((core-typed-samples/hash-of? clojure.core/+ clojure.core/number?)) 


ExceptionInfo Type Checker: Found 2 errors clojure.core/ex-info (core.clj:4327) 
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在 这 个 实验 中 ， 对 hash-of? 的 错误 调用 包装 在 一 个 匿名 函数 中 。 在 本 书 编 
写 时 ，core.typed 会 先 对 代码 求 值 ， 再 对 它 进行 类 型 检查 。 

















没有 这 一 点 ， 原 始 调用 ((hash-of? + number?)) 就 会 返回 一 个 普通 的 


Clojure ArityException。 


参阅 


GitHub 上 的 core.typed 代码 库 (https://github.com/clojure/core.typed)。 
core.typed 用 户 指南 (https://github.com/clojure/coswre.typed/wiki/User-Guide)， 尤 其 是 


关于 多 态 和 函数 标注 的 小 节 。 
10.7 节 “ 用 core.typed 避免 空 指针 异常 ” ,以 及 10.8 节 "用 core.typed 验证 Java 互 操作 ” 
了 解 如 何 使 用 core.typed 的 更 多 例子 。 
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关于 作者 


Luke VanderHart 是 一 名 Clojure 和 ClojureScript 开发 者 ， 目 前 就 职 于 Cognitect 公司 。 他 
是 Practical Clojure( Apress ) 和 ClojureScript: Up and Running (O'Reilly ) 的 合 著者 之 一 ， 
目前 在 北 卡 罗 来 纳 州 达 勒 姆 市 生活 和 工作 。 





Ryan Neufeld 通晓 多 种 计算 机 语言 ， 是 一 名 全 能 软件 开发 者 ， 热 圳 于 分 布 式 系统 和 网 络 应 
用 开发 。Ryan 十 分 善于 为 客户 解决 各 种 或 火 手 或 简单 的 软件 技术 问题 ， 及 时 为 客户 交付 成 
果 。 他 目前 居住 于 北 卡罗来纳 州 达 勒 姆 市 ， 是 Cognitect 公司 的 一 名 开发 人 员 。 


关于 封面 


本 本 书 封面 上 的 动物 是 土 狼 ( Proteles cristata )， 一 种 生活 在 非洲 东部 和 南部 平原 的 小 型 哺 
乳 动 物 ， 共 分 为 两 个 种 群 。 虽 然 其 名 字 在 非洲 荷兰 语 中 的 含义 是 “ 土 狼 ”， 但 它们 实际 上 
属于 最 狗 科 。 不 像 其 体型 较 大 的 近亲 ， 土 狼 一 般 不 以 腐肉 为 食 ， 而 主要 靠 长 而 粘 的 舌头 捕 
食 昆 垄 ( 尤其 是 白蚁 )。 








土 狼 全 身 履 有 厚 厚 的 黄色 或 棕色 的 毛 ， 间 有 深 色 条 纹 ; 尾 长 而 毛 鞍 松 ， 颈 部 和 着 背 线 上 有 
长 长 的 最 毛 。 土 狼 并 不 是 跑步 健将 ， 也 不 擅长 打架 斗 吸 ， 只 能 靠 身上 发 达 的 最 毛 来 涨 涨 威 
风 ， 吓 路 捕 食 者 。 土 狼 的 颌 骨 虽 然 发 达 ， 但 其 牙齿 已 退化 到 只 能 捕食 昆虫 ， 而 不 能 捕食 大 
型 兽 类 。 土 狼 平 均 体 长 为 22~31 英寸 ， 平 均 体重 15~22 磅 。 


土 狼 一 般 夜间 出 没 ， 和 白天 扑 居 于 地 穴 。 土 狼 有 极 强 的 领地 意识 ， 它 们 用 气味 腺 分 沁 物 来 标 
记 含 有 自己 地 穴 的 领地 (一 对 有 交配 关系 的 土 狼 可 能 会 同时 占领 多 个 地 穴 ， 轮 流 使 用 ,但 
每 次 只 使 用 其 中 一 两 个 洞穴 )， 它 们 的 交配 季 一 般 是 六 月 底 七 月 初 ， 孕 期 90 天 左右 ， 产 仔 
2~5 只 。 


土 狼 有 时 会 被 人 们 误 认 作 蜂 狗 而 杀 死 ， 以 保护 家 畜 。 然 而 ， 很 多 非洲 农民 却 认 识 到 了 这 种 
动物 的 益处 一 一 捕食 白蚁 ， 控 制 其 数量 ， 从 而 保护 农作物 生长 。 一 只 土 狼 一 夜 便 可 吃 掉 20 
万 ~30 万 只 和 白蚁 。 


封面 图 片 来 自 Wood 所 著 Animate Creation 一 书 。 
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欢迎 加 入 


图 灵 社 区 ITuring.cn 





最 前 沿 的 IT 类 电子 书 发 售 平台 


电子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同 行 还 在 犹豫 入 得 的 时 候 ， 图 灵 社 区 已 经 采取 实 
际 行动 拥抱 这 个 出 版 业 巨 变 。 作 为 国内 第 一 家 发 售 电子 图 书 的 开 类 出 版 商 ， 图 灵 社 区 目前 为 读者 
提供 两 种 DRM-free 的 阅读 体验 :在线 阅读 和 PDF。 

相 比 纸 质 书 ， 电 子 书 具 有 许多 明显 的 优势 。 它 不 仅 发 布 快 ， 更 新 容易 ， 而 且 尽 可 能 采用 了 彩 
色 图 片 ( 即使 有 的 书 纸 质 版 是 黑白 印刷 的 )。 读 者 还 可 以 方便 地 进行 搜索 、 剪 贴 、 复 制 和 打印 。 

图 灵 社 区 进一步 把 传统 出 版 流程 与 电子 书 出 版 业务 紧密 结合 ， 目 前 已 实现 作 译 者 网 上 交 
稿 、 编 辑 网 上 审 稿 、 按 章 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模式 ， 我 们 称 之 为 “人 敏捷 出 
版 ”， 它 可 以 让 读者 以 较 快 的 速度 了 解 到 国外 最 新 技术 图 书 的 内 容 ， 弥 补 以 往 翻 译 版 技术 书 
“出 版 即 过 时 ”的 缺憾 。 同 时 ， 敏 捷 出 版 使 得 作 、 译 、 编 、 读 的 交流 更 为 方便 ， 可 以 提前 消炎 
书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 的 质量 。 
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优惠 提示 : 现在 购买 电子 书 ， 读 者 将 获 赠 书 款 20% 的 社区 银子 ， 可 用 于 免 换 纸 质 样 书 。 


一 一 最 方便 的 开放 出 版 平台 


图 灵 社 区 向 读者 开放 在 线 写 作 功 能 ， 协 助 你 实现 自 出 版 和 开源 出 版 的 梦想 。 利 用 “合集 ” 
功能 ， 你 就 能 联合 二 三 好 友 共 同 创作 一 部 技术 参考 书 ， 以 免费 或 收费 的 形式 提供 给 读者 。( 收 
费 形式 须 经 过 图 灵 社 区 立项 评审 。 ) 这 极 大 地 降低 了 出 版 的 门槛 。 只 要 你 有 写作 的 意愿 ， 图 灵 
社区 就 能 帮助 你 实现 这 个 梦想 。 成 熟 的 书稿 ， 有 机 会 人 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 

图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 社区 公布 。 如 果 你 有 意 翻译 哪 本 图 
书 ， 欢 迎 你 来 社区 申请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 译 者 。 当 然 ， 要 想 成 功 
地 完成 一 本 书 的 翻译 工作 ， 是 需要 有 坚强 的 毅力 的 。 


最 直接 的 读者 交流 平台 


在 图 灵 社 区 ,你 可 以 十 分 方便 地 写作 文章 、 提 交 勘 误 、 发 表 评 论 ， 以 各 种 方式 与 作 译 者 、 
辑 人 员 和 其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 银子 。 

你 可 以 积极 参与 社区 经 常 开展 的 访谈 、 乐 译 、 评 选 等 多 种 活动 ， 赢 取 积 分 和 银子 ， 积 累 个 人 
声望 。 
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OREILLY 





Clojure 经 典 实 例 


本 书 涵盖 150 多 个 具体 实例 ， 展 示 了 有 经 验 的 Clojure 开 发 者 如 何 用 这 门 “Clojure 是 由 实践 者 所 创 ， 也 是 为 
JVM 语 言 完 成 各 种 编程 任务 。 解 决 方案 全 面 广 泛 : 从 构建 动态 网 站 和 应 实践 者 而 创 ， 而 这 本 书 也 一 样 ， 
用 数据 库 ， 到 网 络 通信 、 云 计算 、 高 级 测试 策略 等 ， 面 面 俱 到 。 这 些 实 它 源 于 实践 ， 面 向 实践 ， 是 


例 源 于 全 球 60 多 名 顶级 Clojure 开 发 者 。 Clojure 实 际 开发 的 全 面 指南 。” 
一 -一 Rich Hick 
本 书 的 每 个 实例 不 仅 可 以 即 学 即 用 ， 而 且 其 中 提供 的 关于 解决 方案 原理 ere 
的 讨论 ， 让 读者 可 以 在 模式 、 方 法 和 技巧 上 举一反三 ， 从 而 在 遇 到 本 书 es 
Cognitect 公 司 CTO 
未 提 及 的 其 他 编程 任务 时 也 能 游 刀 有余 。 
通过 阅读 本 书 ， 你 可 以 : 《Clojure 经 典 实例 》 是 全 球 最 优 
掌握 内 建 原 生 数 据 和 复合 数据 结构 ， 秀 的 Clojure 程 序 员 共同 协作 的 结 
果 ， 他 们 的 从 业 背 景 涵盖 航空 航 
使 用 Leiningen 工 具 创建 、 开 发 和 发 布 库 ; 天 、 社 交 媒 体 、 银 行业 、 机 器 
与 本 地 计算 机 交互 ; 人 、Al 研 究 、 电 子 商务 等 各 行 各 
业 。 
管理 网 络 通信 协议 和 库 ; 
掌握 连接 和 使 用 各 种 数据 库 的 技术 ; 


应 用 Ring HTTP 服 务 器 库 构建 并 维护 动态 网 站 ， 

解决 封装 、 发 布 、 配 置 、 日 志 等 应 用 任务 ; 

进行 云 计 算 和 重量 级 分 布 式 数据 处 理 ， 

深入 研究 单元 测试 、 集 成 测试 、 模 拟 测试 和 基于 属性 的 测试 。 


Luke VanderHart 是 Clojure 和 ClojureScript 开 发 者 ，Clojure/core 成 员 ，Practical 
Clojure (Apress) 合 著 者 之 一 。 


Ryan Neufeld 是 Cognitect 公 司 开发 人 员 ， 分 布 式 系统 和 网 络 应 用 架构 师 。 
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看 完了 


如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com ， 会 有 编辑 或 作 译 者 协助 
答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨论 。 


如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : ebook@turingbook.com。 
在 这 里 可 以 找到 我 们 : 


微 博 @ 图 灵 教 育 : 好 书 、 活 动 每 日 播报 

微 博 @ 图 灵 社 区 : 电子 书 和 好 文章 的 消息 

微 博 @ 图 灵 新 知 : 图 灵 教 育 的 科普 小 组 

微 信 图 灵 访 谈 : ituring_interview， 讲 述 码 农 精彩 人 生 
微 信 图 灵 教 育 : turingbooks 


